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(57) Abstract: The invention relates to a method for 
analyzing gene expression, i.e. for parallel analysis 
of the expression of a large number of genes. Said 
method is based on analysis of sequences on a large 
number of bound chains. Short sequence sections 
from each of these chains are determined, followed 
by evaluation and comparison with gene sequences 
in data banks, providing information about the genes 
thus expressed and the intensity of said expression. 

(57) Zusammenfassung: Die Erfindung betrifft ein 
Verfahren zur Analyse der Genexpression, d.h. zur pa- 
rallelen Analyse der Expression einer grossen Anzahl 
von Genen. Die Methode basiert auf der Analyse von 
Sequenzen an vielen gebundenen Nukleinsaureketten. 
Dazu werden kurze Sequenzabschnitte aus jederdieser 
Ketten ermittelt. Die anschliessende Auswertung 
und der Vergleich mit Gensequenzen in Datenbanken 
erlaubt Aussagcn tibcr die exprimierten Gene und die 
Starke ihrer Expression. 
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Verfahren zur Bestimmuno der Genexpression 
Zusammenf assung : 

Die Erfindung beschreibt ein Verfahren zur parallelen Analyse 
der Expression einer groSen Anzahl von Genen. Diese Methode 
basiert auf der Analyse von Sequenzen an vielen gebundenen Nu- 
kleinsaureketten. Dazu werden kurze Sequenzabschnitte aus jeder 
dieser Ketten ermittelt. Die anschliefiende Auswertung und der 
Vergleich mit Gensequenzen in Datenbanken erlaubt Aussagen uber 
die exprimierten Gene und die Starke ihrer Expression. 

1. Abkurzungen und Begrif f serlauterungen 

DNA - Desoxyribonukleinsaure verschiedenen Ursprungs und unter- 
schiedlicher Lange: (genomische DNA, cDNA, ssDNA, dsDNA) 
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RNA - Ribonukleinsaure (meist mRNA) 

Genprodukte - mRNA-Transkripte oder von der mRNA abgeleitete 
5 Nukleinsaureketten (z.B. einzelstrangige cDNAs, doppelstrangige 
cDNAs , von cDNA abgeleitete RNA oder von cDNA amplif izierte 
DNA) . 

cDNA - komplementare DNA 

10 Polymerasen - Enzyme, die komplementare Nukleotide in einen 
wachsenden DNA- oder RNA- Strang einbauen konnen ( z.B. DNA- 
Polymerasen, Reverse-Transcriptasen, RNA- Polymerasen) 

dNTP - 2 , -deoxi-Nucleosid- Triphosphate, Substrate fur DNA- 
15 Polymerasen und Reverse- Transcript asen 

NTP - Nukleosid-Triphosphate, Substrate fur RNA- Polymerasen 

NT - naturliches Nukleotid, meist dNTP, wenn nicht ausdrucklich 

anders gekennzeichnet . 

20 

Abk&rzung "NT" wird auch bei der Langenangabe einer Nukleinsau- 
resequenz verwendet, z.B. 1.000 NT. In diesem Fall steht "NT" 
fur Nukleosid-Monophosphate. 

25 Im Text wird bei Abkurzungen die Mehrzahl durch Verwendung des 
Suffixes "s" gebildet, "NT" steht zum Beispiel fur 

"Nukleotid", "NTs" steht fur mehrere Nukleotide. 

NT* - modif iziertes Nukleotid, meist dNTP, wenn nicht ausdruck- 
30 lich anders gekennzeichnet. NTs* bedeutet: modif izierte Nukleo- 
tide 

Plane Oberflache: Oberflache, die vorzugsweise folgende 
Merkmale aufweist: 1) Sie erlaubt, mehrere einzelne Molekule, 
35 vorzugsweise mehr als 100, noch besser mehr als 1000, mit dem 
jeweiligen gegebenen Objektiv-Oberf lache-Abstand bei einer 
Objektivposition gleichzeitig zu detektieren. 2) Die 
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immobilisierten bzw. gebundenen einzelnen Molekiile befinden 
sich in derselben Fokusebene, die reproduzierbar eingestellt 
werden kann. 

5 Sterisches Hindernis: Sterisch anspruchs voile Gruppe, die durch 
ihre chemische Struktur die Eigenschaften der mit dieser Gruppe 
gekoppelten NTs* so verandert, dass diese durch eine Polymerase 
in einer Extensionsreaktion nicht nacheinander eingebaut werden 
konnen . 

10 

Definition der Termination: Als Termination wird in dieser An- 
meldung der reversible Stop des Einbaus der modif izierten unge- 
spalteten NTs* bezeichnet. 

Dieser Begriff ist von dem ublichen Gebrauch des Wortes "Termi- 
15 nation" durch Dideoxy-NTP bei einer konventionellen 
Sequenzierung zu trennen, 

Die Termination kommt nach dem Einbau eines modif izierten NT* 
zustande. Das modif izierte eingebaute NT* tragt eine an die Base 
reversibel gekoppelte sterische Gruppe, die zur Behinderung des 
20 Einbaus eines nachsten komplementaren NT* in den wachsenden 
Strang durch eine Polymerase fQhrt. 

SNP - single nucleotide polymorphism 

25 PBS - Primerbindungss telle 

Weitfeld-Optik-Detektionssystem - Detektionssystem, das 
gleichzeitig Fluoreszenzsignale von einzelnen, auf einer 
Flache verteilten Molekulen detektieren kann, wobei die Flache 

30 ca. 100 fim 2 xand groBer ist. Ein Beispiel fur Weitfeld- 
Detektionsoptik stellt Fluoreszenzmikroskop Axiovert 200 oder 
Axioplan 2e (Zeiss) mit einem Planneof luar-Objektiv lOOx NA 
1.4 Olimmersion (Zeiss), oder einem Planapochromat-Objektiv 
lOOx NA 1.4 Olimmersion (Zeiss) dar; die Anregung der 

35 Fluoreszenz kann dabei mit einer Lampe, z.B. 
Quecksilberdampflampe, oder einem Laser oder Dioden erfolgen. 
Sowohl Epif luoreszenzmodus als auch Totalref lexions- 
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Fluoreszenzmikroskopie-Modus (total internal reflection 
fluorescence microscopy, TIRF-Microscopy) oder Laser- Scanning - 
Mikroskopie -Modus kdnnen verwendet werden. In dieser Anmeldung 
wird Gebrauch von dieser Weitfeld-Detektionsoptik gemacht. 

5 

2. Stand der Technik: 

Die Analyse des Genexpress ions -Spekt rums ist zu einem wichtigen 
10 Werkzeug in der Wissenschaft geworden. Der Vergleich der 
Genexpressions-Spektren zwischen verschiedenen Zelllinien, 
Geweben oder Entwicklungsstadien erlaubt Ruckschliisse auf die 
darin ablaufenden spezifischen biologischen Prozesse. So kann 
man z.B. erwarten, dass der Vergleich zwischen Tumorzellen und 
15 gesunden Zellen gleicher Herkunft Auskunft uber die am 
Tumorgeschehen beteiligten Gene gibt. Dabei ist wichtig, dass 
die Aktivitat moglichst vieler oder aller Gene gleichzeitig 
analysiert wird, 

20 Die Analyse der Genexpression ist eine komplexe Aufgabe: Die 
Anzahl der in einem Zelltyp aktiven Gene kann mehrere Tausend 
betragen. Die Analyse sollte aber moglichst alle im Genom der 
betreffenden Art enthaltenen Gene (etwa 32000 beim Menschen) 
berucksichtigen. Hinzu konimt, dass die im jeweiligen Zelltyp 

25 aktiven Gene erstens meist noch nicht komplett bekannt sind und 
zweitens unterschiedlich stark exprimiert werden. 

Es wurden bereits viele Methoden zur Genexpressionsanalyse 
entwickelt, so z.B. Differential Display (Nature 1984, v. 308 

30 S.149, Science 1992 v. 257 S.967), Expressed Sequence Tags (EST) 
(Science 1991 v. 252, S.1656, Nature Genetics 1992 # v. 2 S.173), 
Northern blotting oder RT-PCR (PNAS 1977, v. 74, S.5350, Cell 
1983 v.34 S.865, "The PCR Technique, RT-PCR" 1998, Ed. Paul 
Suebert, Eaton Publishing) . Alle diese Methoden kdnnen nur eine 

35 sehr begrenzte Anzahl an Genen pro Reaktion analysieren und 
sind zum Teil sehr arbeitsintensiv. 
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Die am weitesten verbreitete Methode zur parallelen Analyse der 
Genexpressionsmuster ist die Hybridisierung eines zu 
analysierenden Gemischs von cDNA-Molekulen mit am eine 
Oberflache gebundenen Oligonukleotiden, die in einer bestimmten 
5 Anordnung, meist als "Microarray" fixiert sind ("Microarray 
Biochip Technology" 2000, Ed. M.Schena, Eaton Publishing, Zhao 
et al. Gene 1995, v. 156, S.207, Schena et al. Science 1995 
v.270, S.467, Lockhart et al. US Patent 6.040.138, Wang US 
Patent 6.004-755, Arlinghaus et al. US Patent 5.821.060, 
10 Southern US Patent 5.700.637, Fodor et al. US Patent 
5.871.928). 

Zu den groSen Nachteilen der Hybridisierungsmethode zahlen: Die 
Fertigung der an die Oberflache gebundenen Oligonukleotide ist 
15 teuer. Die Analyse beschrankt sich auf Gene, deren Sequenzen 
bereits bekannt sind. Mehrere Mismatch- Kontrollen vergroSern 
die Anzahl der Oligonukleotide, die immobilisiert werden 
mussen. 

20 Die vorliegende Erfindung beschreibt eine Methode zur 
parallelen Analyse einer groSen Anzahl von 

Nukleinsaurekettenmolekiilen. Sie basiert auf der Detektion der 
Fluoreszenzsignale von einzelnen Molekillen. Durch eine 
gleichzeitige Sequenzierung einzelner Genproduktmolekule erhalt 

25 die Methode mehrere Vorteile gegenuber dem Stand der Technik: 

1) Die Genprodukte k6nnen in einer beliebigen Anordnung auf der 
Oberflache binden. Eine vorherige aufwendige Synthese von 
verschiedenen Oligonukleotiden an bestimmten Positionen (wie 

30 beispielsweise bei der Hybridisierungsmethode) ist somit nicht 
notwendig. 

2) Das Material kann auf einer standardisierten Oberflache 
analysiert werden. 

35 

3) Auch die Expression noch unbekannter Gene kann ermittelt 
werden, weil alle im Ansatz enthaltenen Genprodukte analysiert 
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werden. Dies ist mit konventionellen DNA- Arrays nicht moglich. 

4) Die groSe Anzahl der analysierten Molekiile erlaubt auch die 
Detektion schwach exprimierter Gene. 

5 

5) Kleinste Mengen an Ausgangsmaterial konnen eingesetzt 
werden: mRNA aus einer einzelnen Zelle kann fur die Analyse 
ausreichend sein. 

10 6) Samtliche Schritte des Verfahrens konnen weitgehend 
automat isiert werden. 



3. Kurze Beschreibung: 

15 

Die Erfindung beschreibt ein Verfahren zur parallelen Analyse 
der Genexpression, bei dem man 

einzelstrangige Genprodukte bereitstellt, man 

20 

die Genprodukte unter Verwendung eines einheitlichen oder 
mehrerer unterschiedlicher Primer in Form von Genprodukt- 
Pr inter- Komplexen auf einer Reaktionsoberf lache in einer 
zufalligen Anordnung bindet, man 

25 

eine zyklische Aufbaureaktion des komplementaren Stranges der 
Genprodukte unter Verwendung einer oder mehrerer Polymerasen 
durchfiihrt, indem man 

30 a) zu den auf der Oberf lache gebundenen Genpr odukt- Primer - 
Komplexen eine Losung zugibt, die eine oder mehrere 
Polymerasen und ein bis vier modifizierte Nukleotide (NTs*) 
enthalt, die mit Fluoreszenzfarbstof fen markiert sind, 
wobei die bei gleichzeitiger Verwendung von mindestens 

35 zwei NTs* jeweils an den NTs* befindlichen Fluoreszenzfarb- 

stoffe so gewShlt sind, dass sich die verwendeten NTs* 
durch Messung unterschiedlicher Fluoreszenzsignale vonein- 
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ander unterscheiden lassen, wobei die NTs* strukturell an 
der Base so modifiziert sind, dass die Polymerase nach 
Einbau eines solchen NT* in einen wachsenden komplementaren 
Strang nicht in der Lage ist, ein wei teres NT* in denselben 
5 Strang einzubauen, wobei der Fluoreszenzfarbstof f 

abspaltbar ist und die strukturelle Modifikation ein 
abspaltbarer sterisch anspruchsvoller Ligand ist, man 



b) die in Stufe a) erhaltene stationare Phase unter 
10 Bedingungen inkubiert, die zur Verlangerung der kom- 
plementaren Strange geeignet sind, wobei die komplemen- 
taren Strange jeweils urn ein NT* verlangert werden, man 

c) die in Stufe b) erhaltene stationare Phase unter 
15 Bedingungen wascht, die zur Entfernung nicht in einen 

komplementaren Strang eingebauter NTs* geeignet sind, man 

d) die einzelnen, in komplementare Strange eingebauten NTs* 
durch Messen des fur den jeweiligen Fluoreszenzfarbstof f 

20 charakteristischen Signals detektiert, wobei man gleich- 

zeitig die relative Position der einzelnen Fluo- 
reszenzsignale auf der Reaktionsoberf lache bestimmt, man 

e) zur Erzeugung unmarkierter, (NTs Oder) Genprodukte die 
25 Fluoreszenzf arbstof f e und die sterisch anspruchsvollen 

Liganden von den am komplementaren Strang angefugten NTs* 
abspaltet, man 

f) die in Stufe e) erhaltene stationare Phase unter 
30 Bedingungen wascht, die zur Entfernung der Fluoreszenz- 

farbstoffe und der Liganden geeignet sind, man 

die Stufen a) bis f) gegebenenfalls mehrfach wiederholt, 

35 wobei man die relative Position einzelner Genprodukt- Primer - 
Komplexe auf der Reaktionsoberf lache und die Sequenz dieser 
Genprodukte durch spezifische Zuordnung der in Stufe d) in auf- 
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einanderfolgenden Zyklen an den jeweiligen Positionen detek- 
tierten Fluoreszenzsignale zu den NTs bestimmt und man aus den 
ermittelten Teilsequenzen die Identitat der Genprodukte 
bestimmt . 

5 

Bei den Genprodukten handelt es sich um die primaren Gen- 
produkte der Gene, deren Expression analysiert werden soil. Im 
wesentlichen handelt es sich dabei um RNA-Transkripte der 
genannten Gene, welche auch als Target -Sequenzen (oder Target - 
10 Nukleinsauresequenzen) bezeichnet werden. Diese Target- 
Sequenzen schlieSen neben mRNA auch davon abgeleitete 
einzelstrSngige und doppelstrSngige cDNA, von cDNA abgeleitete 
RNA oder von cDNA amplif izierte DNA ein. 

15 Die Genprodukte oder Target -Sequenzen k&nnen entweder als mRNAs 
direkt aus einer biologischen Probe (z.B. Zellextrakt, 
Gewebeextrakt oder Extrakt von ganzen Organismen) isoliert oder 
als cDNAs durch reverse Transkription der mRNAs erhalten 
werden . 

20 

Unter einer hoch parallelen Analyse wird in diesem Zusammenhang 
die gleichzeitige Sequenzanalyse vieler Genprodukt-Molekule 
verstanden (beispielsweise mindestens etwa 100.000, 
vorzugsweise mindestens etwa 500.000, insbesondere aber 
25 mindestens etwa 1.000.000 bis etwa 10.000.000), wobei diese 
Genprodukt-Molekule eine komplexe heterogene Population 
darstellen, die z.B. einem kompletten Express ionsprof il bzw. 
einem Expressionsspektrum eines Gewebes entspricht. 

30 Gemafi einer besonderen Ausfuhrungsform der Erfindung kann das 
Verfahren durchgefiihrt werden, indem man die Stufen a) bis f) 
der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man 

a) in jedem Zyklus nur jeweils ein markiertes NT*, 
35 b) in jedem Zyklus jeweils zwei unterschiedlich markierte NTs* 
oder 

c) in jedem Zyklus jeweils vier unterschiedlich markierte NTs* 



WO 02/088381 



- 9 - 



PCT/EP02/04657 



einsetzt . 

Das Verfahren kann auch durchgefiihrt werden, indem man die 
5 Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach 
wiederholt, wobei man in den Zyklen abwechselnd jeweils zwei 
unterschiedlich markierte NTs* und zwei unmarkierte NTs einsetzt 
und man die Identitat der Genprodukte durch Vergleich mit den 
Referenzsequenzen ermittelt. 

10 

Gegenstand der vorliegenden Erfindung sind ferner die in den 
Figuren 6e, 6f und 6g dargestellten Nukleotide und die ent- 
sprechenden markierten Nukleotide, die beispielsweise an die 
terminale Aminofunktion angeheftete Fluoreszenzfarbstof fe 
15 aufweisen, Oder die in den Figuren 6h, 6i Oder 6j dargestellten 
markierten Nukleotide. 

Gegenstand der vorliegenden Erfindung ist ferner die Verwendung 
der in Figuren 6e,6f und 6g dargestellten Nukleotide und der 
20 entsprechenden mit einem Fluoreszenzfarbstof f markierten 
Nukleotide fur das erf indungsgemaSen Verfahren. 

Gegenstand der vorliegenden Erfindung ist ferner die Verwendung 
der an der Base modif izierten NT*s (Beispiele siehe Figuren 
25 6k, 6L urid 6m) und der entsprechenden mit einem 
Fluoreszenzfarbstof f markierten Nukleotide fur das 
er f indungsgemafce Verfahren . 

Die Methode basiert auf mehreren Prinzipien: 

30 

1. Kurze Nukleotidsequenzen (10-50 NTs) enthalten genugend 
Informationen zur Identif izierung des korrespondierenden Gens, 
wenn die Gensequenz selbst bereits in einer Datenbank enthalten 
ist. 

35 Eine Sequenz aus beispielsweise 10 NTs kann mehr als 10 6 
verschiedene Kombinationen bilden. Das ist z.B. fur die meisten 
Gene im menschlichen Gehom, das nach heutiger Schatzung 32000 
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Gene enth&lt, ausreichend. Fur Organismen mit weniger Genen 
kann die Sequenz noch kixrzer sein. 

2. Der Methode liegt ein neues Verfahren zur Sequenz ierung 
5 einzelner Nukleinsaurekettenmolekule zugrunde. 

3. Es konnen Nukleinsaureketten-Gemische untersucht werden. 

4. Die Sequenz ierungsreakt ion lauft an vielen Molekulen gleich- 
10 zeitig ab, wobei die Sequenz jeder einzelnen gebundenen 

Nukleinsaurekette analysiert wird. 

Es ist bekannt, dass zur Untersuchung der Genexpression tnRNAs 
Oder von der mRNA abgeleitete Nukleinsaureketten (z.B. 
15 einzelstrangige cDNAs, doppelstrangige cDNAs, von cDNA 
abgeleitete RNA oder von cDNA amplif izierte DNA) eingesetzt 
werden kann. Unabhangig von der genauen Zusammensetzung werden 
sie im folgenden als Genprodukte bezeichnet. Auch Teilsequenzen 
dieser Genprodukte werden im folgenden als Genprodukte 
, 20 bezeichnet . 

Diese Genprodukte stellen ein Gemisch aus verschiedenen Nu- 
kleinsaureketten dar. 

Als Grundlage der Analyse dient die Synthese eines zum 

25 Genprodukt komplementaren Stranges. 

Das Ziel der Vorbereitung ist # auf einer planen Oberflache in 
zufailiger Weise gebundene Genprodukt- Primer- Komplexe 
bereitzustellen, an denen der Einbau von NT*s durch die 
Polymerase stattfinden kann (extensionsfahige Genprodukt - 

30 Primer-Komplexe) . 

Mit diesen gebundenen Genprodukt- Primer -Komplexen wird die 
Sequenz ierungsreakt ion durchgefuhrt . 

Sie verlauft in mehreren Zyklen. Pro Zyklus wird jeweils nur 
ein einziges markiertes NT* in den wachsenden Strang eingebaut. 
.35 Ein Zyklus umfasst folgende Schritte: 

a) Zugabe einer Losung mit markierten Nukleotiden (NTs*) und 
Polymerase zu gebundenen Genprodukt -Primer- Komplexen, 



WO 02/088381 PCT/EP02/04657 

- 11 - 

b) Inkubation der gebundenen Genprodukt- Primer -Komplexe mit 
dieser Losung unter Bedingungen, die zur Verlangerung der 
komplementaren Strange um ein NT geeignet sind, 

c) Waschen, 

5 d) Detektion der Signale von einzelnen modif izierten, in die 
neu synthetisierten Strange eingebauten NTs*-Molekulen, 

e) Entfernung der Markierung von den eingebauten Nukleotiden, 

f) Waschen. 

10 Dieser Zyklus kann mehrmals wiederholt werden, so dass von 
jedem an der Sequenzierungsreaktion teilnehmenden Genprodukt - 
Primer- Kompl ex vorzugsweise 10 bis 50 NTs ermittelt werden. 
Danach erfolgt die Rekonstruktion der Nukleinsauresequenzen aus 
den detektierten Signalen. Die ermittelten Sequenzen der 

15 gebundenen Genprodukte werden zur Bestimmung der Abundanzen 
tint ere inander verglichen und durch Vergleich mit Gensequenzen 
in Datenbanken bestimmten Genen zugeordnet. 

Diese allgemeinen Prinzipien der Reaktion werden anhand eines 
20 Beispiels erklart (Fig.l): 

Als Ausgangsmaterial dient ein Gemisch aus mRNA-Molekulen 
(Genprodukte) . Das zu analysierende Material (1) wird auf einer 
geeigneten planen Oberflache gebunden (2) . Dabei vermitteln die 

25 zuvor auf der Oberflache gebundenen Oligo-dT-Primer die Bindung 
von Genprodukten an die Oberflache. Die Genprodukte werden 
durch Hybridisierung (Annealing) an die Primer gebunden. Die 
nicht gebundenen mRNA-Molekule werden durch einen Waschschritt 
entfernt. Danach wird die Sequenzierungsreaktion an der 

30 gesamten Reaktionsoberf lache durchgef uhrt , wobei in die 
extens ions fahi gen Genprodukt - Primer- Komlexe markier te NT* s 
eingebaut werden. Diese Reaktion verlauft zyklisch. Im 1. 
Schritt des Zyklus wird ein markiertes NT* in den wachsenden 
Strang eingebaut: Dabei wird die Reaktion so gesteuert, dass in 

35 jedem Zyklus jeweils nur ein markiertes NT* von einer Polymerase 
(Reverse Transcriptase) in den wachsenden Strang eingebaut 
werden kann. Das wird durch die Verwendung von NTs* erreicht, 
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die eine reversibel gekoppelte, zur Termination fuhrende Gruppe 
tragen. Der Einbau eines weiteren markierten NT* wird dadurch 
verhindert. Die Polymerase und die markierten NTs* werden 
gleichzeitig in die Reaktion eingesetzt (3) . Danach wird das 
5 Reaktionsgemisch entfernt und die Oberf lache in geeigneter Art 
und Weise gewaschen (4) . Nun folgt ein Detektionsschritt (5) . 
Die Oberflache wird mit einer fur die Einzelmolekuldetektion 
geeigneten Vorrichtung (bestehend z.B. aus Lichtguelle, Mikro- 
skop, Kamera, Scant isch, Computer mit Steuerungs- und Bild- 

10 erkennungs- bzw. Bildverarbeitungssof tware) abgescannt und die 
Signale der einzelnen, eingebauten markierten NTs* 
identifiziert. Nach dem Detektionsschritt wird die Markierung 
und die zur Termination fuhrende Gruppe von alien eingebauten 
NTs* entfernt (6) . Die Entfemung kann chemisch, physikalisch 

15 Oder enzymatisch erfolgen. Nach einem sich anschlieSenden 
Waschschritt kann ein neuer Zyklus beginnen. 

4. Detaillierte Beschreibung 

20 

4.1 Auswahl des Materials: 

Genprodukte konnen von verschiedenen biologischen Objekten 
stammen, so z.B. von einzelnen Zellen, Zellpopulationen, einem 

25 Gewebe Oder von kompletten Organismen. Auch biologische 
Fliissigkeiten wie Blut # Sputum Oder Liquor konnen als Quelle 
der Genprodukte dienen. Die Methoden zur Gewinnung der 
Genprodukte aus den verschiedenen biologischen Objekten sind 
bespielsweise folgenden Literaturquellen zu entnehmen: 

30 "Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor 
Laboratory , "Method in Enzymology" 1999, v303, " cDNA library 
protocols" 1997, Ed. I.G. Cowell, Humana Press Inc.. 

Es kann sowohl die Gesamtheit der isolierten Genprodukte als 
35 auch ein durch eine Vorselektion ausgewahlter Teil davon in die 
Sequenzierungsreaktion eingesetzt werden. Durch Vorselektion 
kann man die Menge der zu analysierenden Genprodukte 



WO 02/088381 PCT/EP02/04657 

- 13 - . 

reduzieren. Die Vorselektion kann beispielsweise durch 
molekularbiologische Verfahren wie z.B. PCR-Amplif ikation, Gel- 
Auftrennung oder Hybridisierung mit anderen Nukleinsaureketten 
erfolgen ("Molecular cloning" 1989, Ed. Maniatis, Cold Spring 
5 Harbor Laboratory, "Method in Enzymology" 1999, v303, "cDNA 
library protocols" 1997, Ed. 1.6. Cowell, Humana Press Inc.) 
Vorzugsweise wird die Gesamtheit der Genprodukte als Ausgangs- 
material gewahlt. 

10 4.2 Vorbereitung des Materials: 

Ziel der Vorbereitung des Materials ist es, aus dem Ausgangs- 
material an die Oberflache gebundene, extensionsfahige 
Genprodukt- Primer- Konrplexe zu bilden. Diese haben dann vorzugs- 
weise die in Fig. 2 dargestellte Struktur. Wobei pro Genprodukt 

15 maximal nur ein Primer binden sollte. 

4.2.1 Primerbindungsstelle (PBS): 

Jedes Genprodukt hat vorzugsweise nur eine 

Primerbindungsstelle . 
20 Eine Primerbindungss telle ist ein Sequenzabschnitt, der eine 
selektive Bindung des Primers an das Genprodukt ermoglichen 
soil. 

Als Primerbindungsstellen konnen Abschnitte in der 
25 Nukleinsauresequenz dienen, die in den zu analysierenden 
Sequenzen naturlicherweise vorkommen (z.B. polyA-Strecken in 
mRNA) . Eine Primerbindungsstelle kann auch zusatzlich in das 
Genprodukt eingefuhrt werden (Molecular cloning' 1 1989, Ed. 
Maniatis, Cold Spring Harbor Laboratory , "Method in 
30 Enzymology" 1999, v303, "cDNA library protocols" 1997, Ed. 1.6. 
Cowell, Humana Press Inc.). 

Aus Grunden der Vereinfachung der Analyse kann es wichtig sein, 
dass eine moglichst einheitliche Primerbindungsstelle in alien 
35 Genprodukten vorhanden ist. Dann konnen Primer mit 
einheitlicher Struktur in die Reaktion eingesetzt werden. 
Die Zusammensetzung der Primerbindungsstelle ist nicht einge- 
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schrankt. Ihre Lange betragt vorzugsweise zwischen 10 und 100 

NTs. Die Primerbindungsstelle kann eine funktionelle Gruppe 

tragen, beispielsweise zur Bindung des Genprodukts an die 
Oberflache. Diese funktionelle Gruppe kann z.B. eine Biotin- 
5 oder Digoxigenin-Gruppe sein. 

Als Beispiel fiir die Einfiihrung einer Primerbindungsstelle in 
die Genprodukte wird das Nukleotid- Tailing von antisense cDNA- 
Fragmenten beschrieben. 

10 

Als erstes werden einzelstrangige cDNAs von mRNAs 
synthetisiert. Es resultiert eine Population an cDNA-Molekulen, 
die eine Kopie der mRNA- Population darstellen, sogenannte 
antisense-cDNA. (Molecular cloning" 1989, Ed. Maniatis, Cold 

15 Spring Harbor Laboratory , "Method in Enzymology" 1999, v303, 
" cDNA library protocols" 1997 # Ed. I.O. Cowell, Humana Press 
Inc.). Mit einer terminalen Deoxynucleotidyltransf erase kann 
man mehrere (z.B. zwischen 10 und 20) Nukleosid-monophosphate 
an das 3'-Ende dieser antisense cDNA anknQpfen, z.B. mehrere 

20 Adenosin-Monophosphate ((dA)n-Tail genannt) . Das entstehende 
Fragment wird zur Bindung des Primers, in diesem Beispiel eines 
(dT)n- Primers, verwendet ( "Molecular cloning" 1989 J.Sambrook et 
al. Cold Spring Harbor Laborotary Press, "Method in Enzymology" 
1999 v. 303, S. 37-38) (Fig. 3). 

25 

4.2.2 Primer fur die Sequenzierungsreaktion 

Dieser hat die Funktion, den Start an einer einzigen Stelle des 
Genprodukts zu ermoglichen. Vorzugsweise bindet er an die 
Primerbindungsstelle im Genprodukt. Die Zusammensetzung und die 

30 Lange des Primers sind nicht eingeschrankt . AuBer der 
Startfunktion kann der Primer auch andere Funktionen 
ubernehmen, wie z.B. eine Verbindung der Genprodukt -Primer- 
Komlexe zur Reaktionsoberf lache zu schaffen. Primer sollten so 
an die Lange und Zusammensetzung der Primerbindungsstelle 

35 angepaSt werden, dass der Primer den Start der Sequenzie- 
rungsreaktion mit der jeweiligen Polymerase ermoglicht. 
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Vorzugsweise betragt die Lange des Primers zwischen 6 und 100 
NTs, optimalerweise zwischen 15 und 30 NTs. Der Primer kann 
eine funktionelle Gruppe tragen, die beispielsweise zur Bindung 
des Primers an die Oberflache dient, beispielsweise ist eine 
5 solche funktionelle Gruppe eine Biotingruppe (s. Abschnitt 
Immobilisierung) . sie soil die Sequenzierung nicht storen. Die 
Synthese eines solchen Primers kann z.B. mit dem DNA- 
Synthesizer 380 A Applied Biosystems ausgefiihrt werden oder 
aber als Auf tragssynthese bei einem kommerziellen Anbieter, 
10 z.B. MWG-Biotech GmbH, Deutschland, erstellt werden. 

Es konnen auch unterschiedliche Primer verwendet werden, ein 
definierter Primersatz, oder ein Primergemisch. 

15 Der Primer kann vor der Hybridisierung an die zu analysierenden 
Fragmente auf der Oberfl&che mit verschiedenen Techniken 
fixiert oder direkt auf der Oberflache synthetisiert werden 
beispielsweise nach (McGall et al. US Patent 5412087, Barrett 
et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, 

20 "Microarray biochip technology" 2000 M.Schena Eaton Publishing, 
"DNA Microarrays" 1999 M. Schena Oxford University Press, Fodor 
et al. Science 1991 v. 285 S.767, Timofeev et al. Nucleic Acid 
Research (NAR) 1996, v. 24 S.3142, Ghosh et al. NAR 1987 v. 15 
S.5353, Gingeras et al. NAR 1987 v. 15 S.5373, Maskos et al. NAR 

25 1992 v.20 S.1679) . 

Die Primer werden auf der Oberflache in einer Dichte zwischen 
10 bis 100 pro 100 ym 2 , 100 bis 10.000 pro 100 (im 2 , 10.000 bis 
1.000.000 pro 100/xm 2 oder gr6fier als 1.000.000 pro 100 fim 2 
30 gebunden. 

Der Primer oder das Primergemisch wird mit Genprodukten unter 
Hybridisierungsbedingungen inkubiert, die ihn selektiv an die 
Primerbindungss telle jedes Genprodukts binden lassen. Diese 
35 Primer-Hybridisierung (Annealing) kann vor (1), wahrend (2) 
oder nach (3) der Bindung der Genprodukte an die Oberflache 
erfolgen. Falls Genprodukte als doppelstrangige Nukleinsauren 
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vorliegen, werden sie vor der Hybridisierung durch Hitze 
denaturiert ("Molecular cloning" 1989 J.Sambrook et al. Cold 
Spring Harbor Laborotary Press) . Die Optimierung der 
Hybridisierungsbedingungen hangt von der genauen Struktur der 
5 Primerbindungss telle und des Primers ab und laSt sich nach 
Rychlik et al. (NAR 1990 v. 18 S.6409) berechnen. Im folgenden 
werden diese Hybridisierungsbedingungen als standardisierte 
Hybridisierungsbedingungen bezeichnet. 

10 Falls das Ausgangsmaterial eine poly-A-Strecke Oder eine poly- 
dA-Strecke aufweist (z.B. mRNA, sense cDNA oder antisense-cDNA 
mit (dA) n -Tail) kann man einen oligo-dT-Primer verwenden. Es 
kann allerdings auch ein Primergemisch bestehend aus 12 
verschiedenen Primern mit folgender allgemeiner Struktur 

15 5'(K) n MN3' verwendet werden. Wobei (n) zwischen 10 und 50 liegt, 
vorzugsweise zwischen 20 und 30. "K" steht fur dT oder dU, "M" 
und "N" stehen jeweils fur dA, dT oder dU, dC, dG 
(z.B. 5^- dTdTdTdTdTdTdTdTdTdT 10 dTdTdTdTdTdTdTdTdTdT 20 dAdG- 3 * ) . Ein 
solches Primergemisch ermoglicht einen exakten Start der 

20 Sequenzierungsreaktion am Ende der polyA-Strecke oder der poly- 
dA-Strecke (geankerter Primer) . 

4.2.3 Fixierung von Genprodukt- Primer -Komplexen an die 
Oberflache (Bindung bzw. Immobilisierung von Genprodukten) . 

25 

Ziel der Fixierung (Bindung, Immobilisierung) ist es, 
Genprodukt- Primer -Komplexe auf einer geeigneten planen 
Oberflache in einer Art und Weise zu fixieren, dass eine 
zyklische enzymatische Sequenzierungsreaktion ablaufen kann. 
30 Dies kann beispielsweise durch Bindung des Primers (s.o.) oder 
des Genprodukt s an die Oberflache erfolgen. 

Die Reihenfolge der Schritte bei der Bindung von Genprodukt - 

Primer -Komplexen kann variabel sein: 
35 1) Die Genprodukt-Primer-Komplexe konnen zunachst in einer 
Losung durch Hybridisierung (Annealing) gebildet und 
anschliefiend an die Oberflache gebunden werden. 
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2) Primer k6nnen zunachst auf einer Oberflache gebunden werden 
und Genprodukte anschlieSend an die gebundenen Primer 
hybridisiert werden, wobei Genprodukt-Primer-Komplexe 
entstehen (Genprodukte indirekt an die Oberflache gebunden) 
5 3) Die Genprodukte konnen zunachst an die Oberflache gebunden 
werden (Genprodukte direkt an die Oberflache gebunden) und 
im anschlieSenden Schritt die Primer an die gebundenen 
Genprodukte hybridisiert werden, wobei Genprodukt-Primer- 
Komplexe entstehen. 
10 Die Immobilisierung der Genprodukte an die Oberflache kann 

daher durch direkte Oder indirekte Bindung erfolgen. 

OberflSche und Reaktionsoberf lache sind in dieser Anmeldung als 
gleichwertige Begriffe aufzufassen, auSer wenn explizit auf 

15 eine andere Bedeutung hingewiesen wird. Als Reaktionsoberf lache 
dient die Oberflache einer festen Phase eines beliebigen 
Materials. Dieses Material ist vorzugsweise enzymatischen 
Reaktionen gegeniiber inert und verursacht keine Stdrungen der 
Detektion. Silicon, Glas, Keramik, Kunststoff (z.B. 

20 Polycarbonate oder Polystyrole) , Metall (Gold, Silber, oder 
Aluminium) oder beliebiges anderes Material, das diesen 
funktionalen Anforderungen genugt, kann verwendet werden. 
Vorzugsweise ist die Oberflache nicht verformbar, denn sonst 
ist mit einer Verzerrung der Signale bei der wiederholten 

25 Detektion zu rechnen. 

Falls eine gelartige feste Phase (Oberflache eines Gels) 
verwendet wird, so kann dieses Gel z.B. ein Agarose- oder 
Polyacrylamidgel sein. Das Gel ist vorzugsweise fur Molekule 

3 0 mit einer Molekularmasse unter 5000 Da frei passierbar 
(beispielsweise kann ein 1 bis 2% Agarose -Gel oder 5 bis 15% 
Polyacrylamid Gel verwendet werden) . Eine solche Geloberf lache 
hat anderen festen Oberf lichen gegeniiber den Vorteil, dass es 
zu einer wesentlich geringeren unspezif ischen Bindung von NT*s 

35 an die Oberflache kommt. Durch die Bindung der Genprodukt- 
Primer-Komplexe auf der Oberflache ist die Detektion der 
Fluoreszenzsignale von eingebauten NTs* moglich. Die Signale von 
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freien NTs* werden nicht detektiert, weil sie nicht an das 
Material des Gels binden und somit nicht immobilisiert werden. 
Das Gel ist vorzugsweise auf einer festen Unterlage befestigt 
(Fig. 4) . Diese feste Unterlage kann Silicon, Glas, Keramik, 
5 Kunststoff (z.B. Polycarbonate oder Polystyrole) , Metall (Gold, 
Silber, oder Aluminium) oder beliebiges anderes Material sein. 

Die Dicke des Gels betr&gt vorzugsweise nidht mehr als 0,1 mm. 
Die Geldicke ist jedoch vorzugsweise groSer als die einfache 
Tiefenscharfe des Objektivs, damit unspezifisch an die feste 

10 Unterlage gebundene NTs* nicht in die Fokusebene gelangen und 
damit detektiert werden. Wenn die Tiefenscharfe z.B. 0,3 ]im 
betragt, so liegt die Geldicke vorzugsweise zwischen 1 ym und 
100 Die Oberflache kann als eine kontinuierliche Oberflache 
oder als diskontinuierliche, aus einzelnen kleinen 

15 Bestandteilen (z.B. Agarose-Kugelchen) zusammengesetzte Ober- 
flache hergestellt werden (Fig. 4 a,b) . Die Reaktionsoberf lache 
muS groB genug sein, um die notwendige Anzahl der Genprodukte 
bei entsprechender Dichte binden zu konnen. Die Reaktions- 
oberflache sollte vorzugsweise nicht gr6Ser als 20 cm 2 sein. 

20 

Die verschiedenen Zyklusschritte erfordern einen Austausch der 
unterschiedlichen Reaktionslosungen uber der Oberflache. Die 
Reaktionsoberf lache ist vorzugsweise Bestandteil eines Reak- 
tionsgef afies . Das Reaktionsgef&fi ist wiederum vorzugsweise 

25 Bestandteil einer Reaktionsapparatur mit Durchf lufivorrichtung . 
Die Durchf luBvorrichtung ermoglicht einen Austausch der 
Losungen im Reaktionsgefafi. Der Austausch kann mit einer durch 
einen Computer gesteuerten Pumpvorrichtung oder manuell 
erfolgen. Wichtig dabei ist, dass die Oberflache nicht 

30 austrocknet. Vorzugsweise betragt das Volumen des 
ReaktionsgefaSes weniger als 50 pi. Idealerweise betragt sein 
Volumen weniger als 1 \xl. Ein Beispiel eines solchen 
DuchfluSsystems ist in Fig. 5 gegeben. 

35 Falls die Fixierung der Genprodukt- Primer- Komplexe auf der 
Oberflache uber die Genprodukte erfolgt, kann dies 
beispielsweise durch die Bindung der Genprodukte an einem der 
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beiden Ketten-Enden erfolgen. Dies kann durch entsprechende 
kovalente, affine oder andere Bindungen erreicht werden. Es 
sind viele Beispiele der Immobilisierxmg von Nukleinsauren 
bekannt (McGall et al. US Patent 5412087, Nikiforov et al. US 
5 Patent 5610287, Barrett et al. US Patent 5482867, Mirzabekov et 
al. US Patent 5981734, "Microarray biochip technology" 2000 
M.Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena 
Oxford University Press, Rasmussen et al. Analytical 
Biochemistry v. 198, S.138, Allemand et al. Biophysical Journal 

10 1997, v. 73, S.2064, Trabesinger et al. Analytical Chemistry 
1999, v. 71, S.279, Osborne et al. Analytical Chemistry 2000, 
v. 72, S.3678, Timofeev et al. Nucleic Acid Research (NAR) 1996, 
v.24 S.3142, Ghosh et al. NAR 1987 v. 15 S.5353, Gingeras et al. 
NAR 1987 v.15 S.5373, Maskos et al. NAR 1992 v. 20 S.1679) . Die 

15 Fixierung kann auch durch eine unspezif ische Bindung, wie z.B. 
durch Austrocknung der Genprodukte enthaltenden Probe auf der 
planen Oberflache erreicht werden. Die Genprodukte werden auf 
der Oberflache in einer Dichte zwischen 10 und 100 pro 100 \im 2 , 
100 bis .10.000 pro 100 /xm 2 , 10.000 bis 1000.000 pro 100/xm 2 

20 gebunden. 

Die fur die Detektion notwendige Dichte von extensions f&hi gen 
Genprodukt- Primer -Komplexen betragt ca. 10 bis 100 pro 100 /xm 2 . 
Sie kann vor, wahrend oder nach der Hybridisierung der Primer 
25 an die Genprodukte erreicht werden. 

Beispielhaft werden im folgenden einige Methoden zur Bindung 
naher dargestellt: 

In einer Ausfuhrungsform erfolgt die Bindung der Genprodukt - 
30 Primer -Komplexe iiber Biotin-Avidin oder Biotin- Streptavidin- 
Bindung. Dabei wird Avidin oder Streptavidin auf der Oberflache 
kovalent gebunden, das 5 f -Ende des Primers ist mit Biotin 
modifiziert. Nach der Hybridisierung der modif izierten Primer 
mit den Genprodukten (in Losung) werden diese auf der mit Avi- 
35 din/Streptavidin beschichteten Oberflache fixiert. Die Konzen- 
tration der mit Biotin markierten Genprodukt- Primer- Komplexe 
sowie die Zeit der Inkubation dieser Losung mit der Oberflache 
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wird so gewahlt, dass eine fur die Sequenzierung geeignete 
Dichte erreicht wird. 

In einer anderen Ausfuhrungsform werden die fur die 
5 Sequenzierungsreaktion geeigneten Primer vor der 
Sequenzierungsreaktion auf der Oberflache mit geeigneten 
Methoden fixiert (s.o.). Die einzelstrangigen Genprodukte mit 
jeweils einer Primerbindungsstelle pro Genproduktmolekul werden 
damit unter Hybridisierungsbedingungen inkubiert (Annealing) . 

10 Dabei binden sie an die fixierten Primer und werden dadurch an 
die Oberflache gebunden (indirekte Bindung) . Die Konzentration 
der einzelstrangigen Genprodukte und die 

Hybridisierungsparameter (z.B. Temperatur, Zeit, Puffer) werden 
so gewahlt, dass man eine fur die Sequenzierung geeignete 

15 Dichte von ca. 10 bis 100 ext ens ions fahigen Genprodukt- Primer - 
Komplexen pro 100 \im 2 erreicht. Nach der Hybridisierung werden 
ungebundene Genprodukte durch einen Waschschritt entfernt. Bei 
dieser Ausfuhrungsform wird eine Oberflache mit einer hohen 
Primerdichte bevorzugt, z.B. ca. 1.000.000 Primer pro 100/xm 2 

20 oder noch hoher, da die gewunschte Dichte an Genprodukt -Primer- 
Komplexen schneller erreicht wird, wobei die Genprodukte nur an 
einen Teil der Primer binden. 

In einer anderen Ausfuhrungsform werden die Genprodukte an die 
25 Oberflache direkt gebunden (s.o.) und anschliefiend mit Primern 
unter Hybridisierungsbedingungen inkubiert. Bei einer Dichte 
von ca. 10 bis 100 Genprodukte pro lOO^m 2 wird man versuchen 
alle verfugbaren Genprodukte mit einem Primer zu versehen und 
fur die Sequenzierugnsreaktion verfugbar zu machen. Dies kann 
30 durch hohe Primerkonzentration beispielsweise 1 bis 100 mmol/1 
erreicht werden. Bei einer hoheren Dichte der fixierten 
Genprodukte auf der Oberflache, beispielsweise 10.000 bis 
1.000.000 pro 100/itn 2 , kann die fur die optische Detektion 
notwendige Dichte der Genprodukt- Primer -Komplexe wahrend der 
35 Primer-Hybridisierung erreicht werden. Dabei sind die 
Hybridisierungsbedingungen (z.B. Temperatur, Zeit, Puffer, 
Primerkonzentratin) so zu wahlen, dass die Primer nur an einen 
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Teil der iramobilisierten Genprodukte binden, s. Beispiel 5. 
Falls die Oberflache einer festen Phase (z.B. Silikon Oder 
Glas) zur Immobilisation verwendet wird, wird vorzugsweise eine 
Blockierungslosung auf die Oberflache vor dem Schritt (a) in 
5 jedem Zyklus gebracht, die zur Vermeidung einer unspezif ischen 
Adsorbtion von NTs* an der Oberflache dient. Diese Bedingungen 
fur eine Blockierlosung erfullt beispielsweise eine 
Albuminlosung (BSA) mit einem pH-Wert zwischen 8 und 10. 

10 4.3 Wahl der Polymerase 

Bei der Wahl der Polymerase spielt die Art der verwendeten 
immobilisierten Nukleinsaure (UNA oder DNA) eine entscheidende 
Rolle: 

15 

Falls RNA als Genprodukt (z.B. mRNA) in die Sequenzierungs- 
reaktion eingesetzt wird, konnen handelsubliche RNA-abhangige 
DNA-Polymerasen eingesetzt werden, z.B. AMV-Reverse 
Transcriptase (Sigma) , M-MLV Reverse Transcriptase (Sigma) , 
20 HIV-Reverse Transcriptase ohne RNAse-Aktivitat. Alle Reverse 
Transcriptasen mussen von RNAse-Aktivitat weitgehend frei sein 
("Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor 
Laboratory) . 

25 Falls DNA als Genprodukt (z.B. cDNA) verwendet wird, eignen 
sich als Polymerasen prinzipiell alle DNA-abhangigen DNA- 
Polymerasen ohne S'-S 1 Exonuklease-Aktivitat (DNA-Replication" 
1992 Ed. A. Romberg, Freeman and company NY), z.B. modifizierte 
T7 -Polymerase vom Typ "Sequenase Version 2" (Amersham Pharmacia 

30 Biotech), Klenow Fragment der DNA- Polymerase I ohne 3' -5* 
Exonukleaseaktivitat (Amersham Pharmacia Biotech) , Polymerase 
Beta verschiedenen Ursprungs (Animal Cell DNA Polymerases" 
1983, Fry M. , CRC Press Inc., kommerziell erhaltlich bei 
Chimerx) thermostabile Polymerasen wie beispielsweise Taq- 

35 Polymerase (GibcoBRL) , proHA- DNA- Polymerase (Eurogentec) . 
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4.4.1 Allgemeines Prinzip 

5 Fiir die hoch parallele Genexpressionsanalyse mit einzelnen 
Molekulen (parallele Sequenzanalyse von bis zu 10.000.000 
Genproduktmolekiilen) ist wichtig, dass jedes eingebaute NT* 
wahrend der Sequezierungsreaktion identif iziert wird. Eine 
Voraussetzung dafur ist, dass nur ein einziges NT* pro Zyklus in 
10 die Nukleinsaurekette eingebaut wird. Falls eine Polymerase 
mehrere NTs* nacheinander im selben Zyklus einbaut, so fuhrt 
dies zu einem Fehler in der Sequenzermittlung. Aus diesem Grand 
mufi man den Einbau der NTs* steuern. 

15 Beispielsweise wurden in der BASS-Methode reversible 3 ■ -OH 
modifizierte NTs beschrieben (Dower US Patent 5.547.839, Canard 
et al. US Patent 5.798.210, Rasolonj atovo Nucleosides & 
Nucleotides 1999, v. 18 S.1021, Metzker et al. NAR 1994, v. 22, 
S.4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18, 

20 S.197). Die Spaltung soil dabei unter milden Bedingungen 
photochemisch (Dower US Patent 5.547.839, Welch et al. 
Nucleosides & Nucleotides 1999, v. 18, S.197) oder chemisch 
(Canard et al. US Patent 5.798.210, Rasolonj atovo Nucleosides & 
Nucleotides 1999, v. 18 S.1021) erfolgen. Bei dieser Methode 

25 wird eine groSe Anzahl gleicher einzelstr&ngiger DNA-Stucke an 
einem definierten Ort auf einer OberflSche fixiert und das 
Signal von der Gesamtheit dieser vielen identischen DNA-Stucke 
analysiert. Zu dieser fixierten DNA wird eine Losung mit 
Polymerase und Nukleotiden zugegeben, so dass ein 

30 komplementarer Strang synthetisiert werden kann. Dabei soli die 
Polymerase schrittweise arbeiten: in jedem Schritt wird nur ein 
einziges Nukleotid eingebaut. Dieses wird detektiert, worauf 
die Polymerase in einem nachsten Zyklus das nachste Nukleotid 
einbaut. Bei dieser Methode wurden an der 3"-OH-Gruppe der 

35 Deoxyribose modifizierte Nukeotide verwendet. 



Trotz des Gelingens einiger einzelner Schritte dieser Methode 
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wurde sie nicht zu einem funktionsf&higen Verfahren entwickelt. 
Dies kann beispielsweise auf folgenden Tatsachen beruhen: Beim 
Aufbau der komplementaren Strange tritt sehr schnell eine 
Desynchronisation der Synthese auf, so dass bei jedem Schritt 
5 die Fehler akkumulieren. Deshalb konnen nur sehr kurze 
Fragmente sequenziert werden. Es ist zu betonen, dass alle 
beschriebenen BASS-Methbden nicht auf der Detektion von 
einzelnen Molekulen beruhen. Das Signal wird stattdessen von 
einer grofien Anzahl identischer an einem definierten Ort 

10 immobilisierter Molekule registriert. Die in diesen Methoden 
ubliche Verwendung der Begriffe "einzelne Molekule" und 
"Molekule" zielt dabei nicht auf individuelle, voneinander ge- 
trennte Molekiile, sondern auf eine Population, die aus vielen 
identischen Molekulen besteht. Idehtisch heifit in diesem Fall, 

15 dass die Molekule die gleiche Sequenz haben. 

Ein weiteres Problem stellen die an 3 "-Position modif izierten 
Nukleotide dar. 

Die Synthese der 3 ■ -OH-modif izierten photochemisch spaltbaren 
NTs* ist sehr aufwendig. Die Polymerasen weisen eine sehr unter- 

20 schiedliche Affinitat zu diesen Nukleotidanalogen auf, so dass 
die Nukleinsauresynthese sehr ungleichmaBig bzw. an vielen DNA- 
Stellen gar nicht ablauft (Metzker et al. NAR 1994 v. 22 S.4259, 
Welch et al. Nucleosides & Nucleotides 1999, v. 18 S.197). Aus 
diesem Grund eignen sich diese Analoga nicht oder nur sehr 

25 eingeschrankt fur die Sequenzierungsreaktion. Eine spaltbare 
3»-Ester-Verknupfung (Canard et al. US Patent 5.798.210) kommt 
als Grvmdlage fur eine reversible Termination der Synthese auch 
nicht in Betracht. Die meisten Polymerasen spalten bei 
Verfugbarkeit eines n&chsten komplementaren NT 3 1 -OH-Ester- 

30 Verbindungen, so dass die an die 3'-OH-Gruppe gebundene 
Markierung in die Losung freigesetzt wird und nicht mehr als 
Terminator wirken kann (Rasolonjatovo et al. Nucleosides & 
Nucleotides 1999, v. 18 S.1021, Canard et al. PNAS 1995 v. 92 
S. 10859) . In Positionen, an denen eine Polymerase mehrere 

35 gleiche NTs* nacheinander einbauen kann, fxihrt das zu einem 
fehlerhaften Signal. Im Abschlufibericht des BMBF- 
Verbundsprojekts , f Sequehzierung mit Mult iplexfarbstof fen \ind 
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Kapillarelektrophorese" G. Sagner, 1999, wurde berichtet, dass 
Modif ikationen der 3 "-Position von Nukleotiden zur Aufhebung 
ihrer Substrateigenschaf ten fur Polymerasen gefiihrt haben. 

5 Die Schwierigkeiten bei der Entwicklung passender NT-Analoga 
fur das Verfahren basieren auf folgenden Rahmenbedingungen : 

1) Die Reaktion muss so gesteuert werden, dass die Polymerase NT*s 

einzeln einbaut (Stop des weiteren Einbaus) . 

2) NT*s mussen einen Farbstoff tragen, der den Anforderungen der 
10 Detektion geniigt. 

3) Der Farbstoff muE unter milden Bedingungen abspaltbar sein, so 

dass weder die Genprodukt-Primer-Komplexe, noch einzelne 
Kotnponenten des Systems beschadigt werden. 

4) Die Abspaltung muss mSglichst schnell und quantitativ erfolgen. 
apDer Stop des Einbaus muss reversibel sein und unter milden 

Bedingungen aufgehoben werden konnen. 

Bis jetzt wurde keine praktisch brauchbare Losung f\ir diese 
Probleme in der einschl&gigen Literatur vorgestellt. 

20 

Durch die vorliegende Erfindung werden nunmehr die im Stand 
der Technik bekannten Probleme erstmals gel6st. Erf indungsgemaLS 
werden fur die Sequenzierung NTs* mit einer sterisch 
anspruchsvollen Gruppe an der Base verwendet. 

25 

. Eine an die Base gekoppelte sterisch anspruchs voile Gruppe kann 
zur Behinderung der weiteren Synthese fuhren, wobei diese 
Behinderung in der Fachliteratur als unerwunschte Eigenschaft 
modif izierter NTs bei der Markierung von Nukleinsauren 

30 angesehen wurde. Biotin, Digoxigenin und Fluoreszenzfarbstof fe 
wie Fluoreszein, Tetramethylrhodamine und Cy3 -Farbstoff stellen 
Beispiele einer solchen sterisch anspruchsvollen Gruppe dar 
(Zhu et al. Cytometry 1997, v. 28, S.206, Zhu et al. NAR 1994, 
v.22, S.3418, Gebeyehu et al., NAR 1987, v. 15, S.4513, Niemann 

35 et al. Analytical Biochemistry 1996, v. 234, S.166, Heer et al, 
BioTechniques 1994 v. 16 S.54). 
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Bei der Sequenzierungsreaktion im erf indungsgemaSen Verfahren 
werden tnarkierte NTs* mit einer Polymerase und Nukleinsaureket- 
ten inkubiert. Die NTs* tragen dabei eine an die Base reversibel 
gekoppelte sterisch anspruchsvolle Gruppe. Wenn ein Reaktions- 
5 gemisch, das nur modif izierte NTs* enthotlt, in der Reaktion 
eingesetzt wird, dann kann die Polymerase nur ein einziges NT* 
einbauen. Der Einbau eines nachsten NT* wird sterisch gehemmt. 
Diese NTs* treten somit als Terminatoren der Synthese auf . Nach 
der Entfernung der sterisch anspruchsvollen Gruppe kann das 
10 nachste komplementare NT* eingebaut werden. Weil diese NTs* kein 
absolutes Hindernis zur weiteren Synthese darstellen, sondern 
nur fur den Einbau eines weiteren markierten NT*, werden sie als 
Semiterminatoren bezeichnet . 

15 4,4.2 Allgemeine Struktur des NT* 

Ihre gemeinsamen Merkmale sind in Fig. 6a,b,d dargestellt. 
Diese Struktur ist dadurch charakterisiert, dass an der Base 
uber einen spaltbaren Linker (A-E) eine sterische Gruppe (D) 
20 und der Fluoreszenzmarker (F) gebunden sind. 

Als Grundlage fiir die NTs* dienen Deoxynukleosid-Triphosphate 
mit Adenosin (A), Guanosin(G) , Cytidin (C) und Uridin (U) als 
Nukleosidrest . Anstelle von Guanosin kann Inosin verwendet 
25 werden. 
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Jede Base ist mit einem fur sie charakteristischen Marker (F) 
markiert (Fig. 6) . Der Marker ist ein f luoreszierender Farb- 
5 stoff. Mehrere Faktoren beeinflussen die Wahl des Fluoreszenz- 
farbstoffes. Die Wahl ist nicht eingeschrankt , sofern der Farb- 
stoff folgenden Anforderungen geniigt: 

a) Die verwendete Detektionsapparatur muS diesen Marker als 
10 einziges Molekul gebunden am DNA unter milden Bedingungen (vor- 

zugsweise Reaktionsbedingungen) identif izieren konnen. Die 
Farbstoffe haben vorzugsweise groSe Photostabilitat . Ihre Fluo- 
reszenz wird vorzugsweise von der DNA nicht Oder nur unwesent- 
lich gequencht. 

15 

b) Der an das NT gebundene Farbstoff darf keine irreversible 
Storung der enzymatischen Reaktion verursachen. 

c) mit dem Farbstoff markierte NTs* mussen von der Polymerase in 
20 die Nukleinsaurekette eingebaut werden. 

d) Bei einer Markierung mit verschiedenen Farbstoffen sollen 
diese Farbstoffe keine be tr&cht lichen Oberlappungen. in ihren 
Emissionsspektren aufweisen. 

25 

Im Rahmen der vorliegenden Erfindung verwendbare Fluoreszenz- 
farbstoffe sind in "Handbook of Fluorescent Probes und Research 
Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes mit 
Strukturf ormeln zusammengestellt . Erf indungsgemaJS werden 

30 vorzugsweise folgende Farbstoff klassen als Marker eingesetzt: 
Cyanin- Farbstoffe und deren Abkommlinge (z.B. Cy2, Cy3, Cy5, 
Cy7 Amersham Pharmacia Biotech, Waggoner US-Patent 5.268,486), 
Rhodamine und deren Abkommlinge (z.B. TAMRA, TRITC, RG6,. R110, 
ROX, Molecular Probes), Xanthene-Derivate (z.B. Alexa 568, 

35 Alexa 594, Molecular Probes, Mao et al. US-Patent 6.130.101). 
Diese Farbstoffe sind kommerziell erhaltlich. 
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Dabei kann man je nach spektralen Eigenschaf ten und vorhandener 
Apparatur entsprechende Farbstoffe auswahlen. Die Farbstoffe 
werden an den Linker z.B. uber Thiocyanat- oder Ester-Bindung 
gekoppelt ("Handbook of Fluorescent Probes und Research Chemi- 
5 cals" 6th ed. 1996, R.Haugland, Molecular Probes, Jameson et 
al. Methods in Enzymology 1997 v. 278 3.363, Waggoner Methods in 
Enzymology 1995 v. 246 S.362), s. Beispiele 1 und 2. 

4.4.4 Natur der sterisch anspruchsvollen Gruppe 

10 

Die Gruppe (D) (Fig. 6a,b,d) stellt ein Hindernis fur den 
Einbau eines weiteren komplementaren markierten NT* durch eine 
Polymerase dar. 

15 Biotin, Digoxigenin und Fluoreszenzfarbstof fe wie Fluoreszein, 
Tetramethylrhodamine und Cy3-Farbstof f stellen Beispiele einer 
solchen sterisch anspruchsvollen Gruppe dar (Zhu et al. Cytome- 
try 1997, v. 28, S.206, Zhu et al. NAR 1994, v. 22, S.3418, 
Gebeyehu et al., NAR 1987, v. 15, S.4513, Wiemann et al. 

20 Analytical Biochemistry 1996, v. 234, S.166, Heer et al. 
BioTechniques 1994 v. 16 S.54). Die chemische Struktur dieser 
Gruppe ist nicht eingeschrankt , sofern sie den Einbau des 
markierten NT*, an das sie geknupft ist, nicht wesentlich stort 
und keine irreversible Stoning der enzymatischen Reaktion 

25 verursacht. 

Diese . Gruppe kann als selbstandiger Teil im Linker (6a) auf- 
treten oder mit dem Farbstoff (6b) oder der spaltbaren Gruppe 
(6d) identisch sein. Durch die Spaltung des Linkers wird diese 
30 sterisch anspruchsvolle Gruppe (D) nach der Detektion des Si- 
gnals entfernt, so dass die Polymerase ein weiteres markiertes 
NT* einbauen kann. Bei einer Struktur wie in 6d wird die steri- 
sche Gruppe durch die Spaltung beseitigt. 

35 In einer bevorzugten Ausfuhrungsform \ibernimmt der Fluoreszenz- 
farbstoff die Funktion einer solchen sterisch anspruchsvollen 
Gruppe, so dass ein markiertes Nukleotid eine in Fig. 6b,k,l 
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dargestellte Struktur aufweist. 

In einer anderen bevorzugten Ausfuhrungsform iibernimmt die 
photolabile spaltbare Gruppe die Funktion einer solchen 
5 sterisch anspruchsvollen Gruppe (Fig. 6d) . 

4.4.5 Linker 

Der Marker (Fluoreszenzfarbstof f ) ist an die Base vorzugsweise 
10 uber einen Abstandhalter unterschiedlicher Lange, einen sog. 
Linker, gebunden. Beispiele fur Linker sind in Fig. 
6e, f , g,h, i, j ,k, l,m gegeben. Beispiele der Ankoppelung eines 
Linkers an die Base konnen aus folgenden Quellen entnommen 
werden (Hobbs et al. US Patent 5.047.519, Khan et al. US Patent 
15 5.821.356, Klevan et al. US Patent 4.828.979, Hanna M. Method 
in Enzymology 1996 v. 274, S.403, Zhu et al. NAR 1994 v. 22 
S.3418, Herman et al. Methods in Enzymology 1990 v. 184 S.584, 
J.L.Ruth et al. Molecular Pharmacology 1981 v. 20 S.415, L. 
Otvos et al. NAR 1987 v. 15 S.1763, G.E.Wright et al. Pharmac 
20 Ther. 1990 v. 47, S.447, „Nucleotide Analogs; Synthesis and 
Biological Function" K.H. Scheit 1980, Wiley- Interscience 
Publication, "Nucleic acid chemistry" Ed. L.B.Townsend, v. 1-4, 
Wiley- Interscience Publication, "Chemistry of Nucleosides and 
Nucleotides" Ed. L.B.Townsend, v. 1-3, Plenum Press) . 

25 

Die gesamte Lange des Linkers kann variieren. Sie entspricht 
der Anzahl der Kohlenstof f -Atome in den Abschnitten A, C, E 
(Fig. 6a,b,d) und liegt vorzugsweise zwischen 3 und 20. 
Optimalerweise betragt sie zwischen 4 und 10 Atomen. Die 
30 chemische Zusammensetzung des Linkers (Abschnitte A, C,E in Fig. 
6a,b,d) ist nicht eingeschrankt, sofern sie unter 
Reaktionsbedingungen stabil bleibt und keine Storung der 
enzymatischen Reaktion verursacht. 

35 4.4.6 Spaltbare Verbindung, Spaltung 



Der Linker tragt eine spaltbare Verbindung oder spaltbare 



WO 02/088381 PCT/EP02/04657 

- 29 - 

Gruppe (Abschnitt (B) in Fig. 6a,b,d und Abschnitt (C) in Fig. 
6k, 1). Diese spaltbare Verbindung ermdglicjit die Entfernung des 
Markers und des sterischen Hindernisses am Ende jedes Zyklus. 
Ihre Wahl ist nicht eingeschrankt, sofern sie unter den Bedin- 
5 gungen der enzymatischen Sequenzierungsreaktion stabil bleibt, 
keine irreversible Stoning der Polymerase verursacht und unter 
milden Bedingungen abgespalten werden kann. Unter "milden 
Bedingungen" sind solche Bedingungen zu verstehen, die den 
Genprodukt-Primer-Komplex nicht zerstoren, wobei z.B. der pH- 

10 Wert vorzugsweise zwischen 3 und 11 liegt, die Temperatur 
zwischen 0°C und einem Temperaturwert (x) . Dieser Temperaturwert 
(x) hangt von der Tm des Genprodukt-Primer-Komplexes (Tm ist 
"melting Point") und wird beispielsweise als Tm (Genprodukt- 
Primer-Komplex) minus 5°C errechnet (z.B. Tm ist 47°C, dann 

15 liegt die maximale Temperatur bei 42°C; unter diesen Bedingungen 
eignen sich besonders Ester-, Thioester-, Disulf id-Verbindungen 
und photolabile Verbindungen als spaltbare Verbindungen) . 

Vorzugsweise gehort die genannte Verbindung zu chemisch oder 

20 enzymatisch spaltbaren oder photolabilen Verbindungen. Als 
Beispiele von chemisch spaltbaren Gruppen sind Ester-, 
Thioester- und Disulf id-Verbindungen bevorzugt (Fig. 6k # l) 
(„Chemistry of protein conjugation and cross linking" Shan S. 
Wong 1993 CRC Press Inc., Herman et al. Method in Enzymology 

25 1990 v.184 S.584, Lomant et al. J.Mol.Biol. 1976 v. 104 243, 
"Chemistry of carboxylic acid and esters" S.Patai 1969 
Interscience Publ . ) . Beispiele fur photolabile Verbindungen 
(Fig. 6m) k6nnen in folgenden Literaturstellen gefunden werden: 
"Protective groups in organic synthesis" 1991 John Willey & 

30 Sons, Inc., V. Pillai Synthesis 1980 S.l, V. Pillai 
Org.Photochem. 1987 v. 9 S.225, Dissertation „Neue photolabile 
Schutzgruppen fur die lichtgesteuerte Oligonucleotidsynthese" 
H. Giegrich, 1996, Konstanz, Dissertation „Neue photolabile 
Schutzgruppen fur die lichtgesteuerte Oligonucleotidsynthese" 

35 S.M.Buhler, 1999, Konstanz) . 



Die Position der spaltbaren Verbindung/Gruppe im Linker ist 
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vorzugsweise nicht weiter als 10 Atome von der Base entfernt, 
noch bevorzugter nicht weiter als 3 Atome. Besonders bevorzugt 
liegt die spaltbare Verbindung oder Gruppe direkt an der Base. 

5 Der Spaltungs- \ind Entfernungs-Schritt ist in jedem Zyklus vor- 
handen und muS unter milden Bedingungen (s.o.) verlaufen, so 
dass die Nukleinsauren nicht beschcLdigt oder modifiziert 
werden. 

10 Die Spaltung lauft bevorzugt chemisch (z.B. in milder saurer 
oder basischer Umgebung fur eine Ester-Verbindung oder durch 
Zugabe eines Reduktionsmittels, z.B. Dithiothreitol oder 
Mercaptoethanol (Sigma) bei der Spaltung einer Disulfid- 
Verbindung) , siehe Beispiel 1, oder physikalisch (z.B. durch 

15 Beleuchtung der Oberflache mit Licht einer bestimmten 
Wellenlange fur die Spaltung einer photolabilen Gruppe, 
Dissertation „Neue photolabile Schutzgruppen fiir die 
lichtgesteuerte Oligonucleotidsynthese" H. Giegrich, 1996, 
Konstanz) ab. 

20 

Nach der Spaltung verbleibt an der Base ein Linkerrest (A) 
(Fig. 6c) . Falls die nach der Spaltung am Linkerrest frei 
gewordene Mercapto- Gruppe weitere Reaktionen stort, kann sie 
mit bekannten Mitteln chemisch modifiziert werden (wie z.B. 
25 durch Disulf id- oder Iodacetatverbindungen) . 

Die Synthese eines spaltbaren Linkers wird an Beispielen 
gezeigt (vgl. Beispiele 1 und 2). 

30 4.4.7 Kombination von Polymerase und NT* 

Insgesamt spielen die GroSe, die Ladung und die chemische 
Struktur des Markers, die Lange des spaltbaren Linkers und des 
Linker-Rests sowie auch die Wahl der Polymerase eine wichtige 
35 Rolle. Sie bestimmen gemeinsam, ob das markierte NT* durch die 
Polymerase in die wachsende Nukleinsaurekette eingebaut wird, 
und ob dadurch der Einbau des nachsten markierten NT* verhindert 
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wird. Zwei Bedingungen sind dabei besonders zu beriicksichtigen: 

Einerseits ist es wichtig, dass die Polymerase die 
Nukleinsaurekette mit dem eingebauten modif izierten NT* nach der 
5 Spaltung des Linkers weiter verlangern kann. Es ist also 
wichtig, dass der Linkerrest "A" (Fig. 6c) nach der Spaltung 
keine wesentliche Storung fur die weitere Synthese darstellt. 
Andererseits mussen eingebaute, nicht gespaltene NTs* ein 
Hindernis darstellen. Es konnen viele fur die Reaktion 
10 geeignete NTs* synthetisiert werden. Im einzelnen mufi fur jede 
Kombination aus Polymerase und NTs* eine Vorversuchsreihe 
durchgefuhrt werden, in der die Tauglichkeit eines bestimmten 
NT*-Typs fur die Sequenzierung erprobt wird. 

15 Die Pufferbedingungen werden nach Angaben des 
Polymeraseherstellers gewahlt. Die Reaktionstemperatur wird fur 
nicht thermostabile Polymerasen nach Angaben des Herstellers 

gewahlt (z.B. 37°C fiir Sequenase Version 2), fur thermostabile 
Polymerasen (z.B. Taq- Polymerase) betragt die 

20 Reaktionstemperatur maximal den Temperaturwert (x) . Dieser 
Tenrperaturwert (x) hangt von der Tm des Genprodukt- Primer - 
Komplexes und wird z.B. als Tm (Genprodukt-Primer-Komplex) 

minus 5°C errechnet (z.B. Tm ist 47°C, dann liegt die maximale 
Reaktionstemperatur bei 42°C) . Diese Puf f erbeding\angen und 
25 Reaktionstemperatur werden weiter als "optimale Puffer- und 
Temperaturbedingungen" bezeichnet. 

Die Reaktionszeit (entspricht der Dauer des Einbau-Schrittes in 
einem Zyklus) betragt vorzugsweise weniger als eine Stunde, 
30 idealerweise liegt die Reaktionszeit zwischen 10 sec und 10 
min. 

Als Beispiele von geeigneten Kombinationen zwischen NT* und 
Polymerase sind folgende Kombinationen zu nennen: 

35 

Falls DNA (z.B. cDNA) als Genprodukt in die Reaktion eingesetzt 
wird, konnen NT* mit einem kurzen Linkerrest (Synthese siehe 
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Beispiel 2, Fig. 6e,h,i): dNTP-SS-TRITC (L7) , dNTP-SS-Cy3 (Lll) 
und / oder NT* mit einem langen Linkerrest (Synthese siehe 
Beispiel 1, Fig. 6f,g,j): dNTP-SS-TRITC (L14) in Kombination 
mit Sequenase Version 2, Taq-Polymerase (GibcoBRL) , ProHA-DNA- 
5 Polymerase (Eurogentec) oder Klenow Fragment der DNA- Polymerase 
I. aus E.coli ohne 3' -5' Exonukleaseaktivitat (Amersham 
Pharmacia Biotech) eingesetzt werden. 

Falls RNA (z.B. mRNA) als Genprodukt in die Reaktion eingesetzt 
10 wird, konnen NT* mit einem kurzen Linkerrest (Synthese siehe 
Beispiel 2, Fig. 6e,h,i): dNTP-SS-TRITC (L7) , dNTP-SS-Cy3 (Lll) 
und / oder NT* mit einem langen Linkerrest (Synthese siehe 
Beispiel 1, Fig. 6f,g,j): dNTP-SS-TRITC (L14) in Kombination 
mit AMV-Reverse Transcriptase (Sigma) , M-MLV Reverse 
15 Transcriptase (Sigma) , HIV-Reverse Transcriptase ohne RNAse- 
Aktivitat eingesetzt werden. 

Die Tauglichkeit eines Linkerrests an der Base (A) fur die 
Reaktion wird in einem Testsystem gepruft. Dabei werden 

20 gespaltene NTs* in eine Nukleinsaurekette nacheinander 
eingebaut. Man verwendet z.B. dUTP* mit dem gewunschten 
gespaltenen Linkerrest, poly-dA als Matrize fur DNA-Polymerasen 
wie z.B. Sequenase Version 2, Taq- Polymerase, oder poly-A als 
Matrize ftir Reverse Transcriptasen wie z.B. AMV-Reverse 

25 Transcriptase (Sigma) , M-MLV Reverse Transcriptase (Sigma) , 
01 igo-dT20- Primer, die gewiinschte Polymerase (s.o.) und fuhrt 
unter fiir die jeweilige Polymerase geeigneten optimalen Puffer- 
und Temperaturbedingungen eine Reaktion durch. Die NT*- 
Konzentration liegt vorzugsweise zwischen 5/xmol/l und 

30 200/xmol/l. Nach der Reaktion wird die Anzahl der in die 
Nukleinsaurekette eingebauten NTs* analysiert, z.B. durch die 
Auftrennung der Lange nach in einem Gel. Fiir die Ruckschlusse 
auf die Tauglichkeit des Linkerrests kann man folgende Angaben 
verwenden: Wenn die Polymerase mehr als 20 NTs* einbauen kann, 

35 so ist dieser Linkerrest fur eine Sequenzierungsreaktion 
geeignet. Beim Einbau von weniger als 20 gespaltenen NTs* ist 
diese Kombination aus NT* und Polymerase nicht optimal fur die 
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Sequenzierungsreaktion. 
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Wenn ein passender Linkerrest feststeht, wird in einem weiteren 
Testsystem gepruft, ob die markierten, nicht gespaltenen NTs* 
5 als Semiterminatoren funktionieren. Das wird gepruft, indem die 
markierten NTs* unter fur die Reaktion geeigneten optimalen 
Puffer- und Temperaturbedingungen mit der Polymerase und einer 
Matrize inkubiert werden. Die NT*-Konzentration liegt vorzugs- 
weise zwischen 5/xmol/l und 200/imol/l- Die Matrize ist so zu 
10 wahlen, dass der Einbau mehrerer NTs* nacheinander zu erwarten 
ware, z.B. fur dUTP* kann man polydA oder poly-A, wie im oben 
dargestellten Beispiel verwenden. Idealerweise baut die 
Polymerase nur ein einziges NT* ein. 

15 Falls bei gegebenen optimalen Puffer- und Temperaturbedingungen 
durch eine Polymerase mehrere NTs* nacheinander eingebaut 
werden, kann man die Reaktionsparameter (z.B. NT*-Konzentration, 
Reaktionstemperatur) verandern und der jeweiligen Kombination 
aus Polymerase und NT* anpassen. Das wichtigste dabei ist # dass 

20 die Polymerase in der vorgegebenen Zeit (liegt vorzugsweise 
zwischen 10 sec und 10 min) ein zweites NT* nicht einbaut. 
Erf indungsgemafi erfolgt diese Anpassung in einer 
Ausfuhrungsform durch die Veranderung der Reaktionstemperatur. 
Die anderen Parameter der Reaktion werden dabei konstant 

25 gehalten. 

Falls DNA als Genprodukt (z.B. cDNA) in die Sequenzierungs- 
reaktion eingesetzt wird, konnen als Polymerasen beipielsweise 
Polymerasen verwendet werden, die DNA- Polymerasen ohne 3' -5'- 

30 Exonukleaseaktivitat sind, vorzugsweise aus der Gruppe beste- 
hend aus viralen DNA- Polymerasen vom Sequenase-Typ, 
bakteriellen DNA- Polymerasen I, thermostabilen DNA- Polymerasen 
und deren Modif ikationen. Insbesondere kommen Sequenase Version 
2, Klenow Fragment der DNA- Polymerase I aus E.coli ohne 3* -5' 

35 Exonukleaseaktivitat, Taq- Polymerase oder ProHA-DNA- Polymerase 
in Betracht. 

Falls RNA als Genprodukt (z.B. mRNA) in die Sequenzierungs- 
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reaktion eingesetzt wird, konnen handelsubliche RNA-abhSngige 
DNA- Polymerasen eingesetzt werden, z.B. AMV-Reverse 
Transcriptase (Sigma) , M-MLV Reverse Transcriptase (Sigma) , 
HIV-Reverse Transcriptase ohne RNase-Aktivitat . 

5 

Die NT* -Konzentration liegt bei diesen Experimenten ublicherwei- 
se zwischen 5/xmol/l und 200/xmol/l, vorzugsweise zwischen 
10/zmol/l und 100/xmol/l. Die Konzentration der Polymerase und 
die Puf ferbedingungen werden nach Angaben vom Hersteller 

10 gewahlt. Die Dauer der Reaktion kann variieren und liegt 
vorzugsweise zwischen 10 sec und 10 min, was der Dauer des 
Einbau-Schrittes (b) in einem Zyklus entsprechen wiirde. Bei 
nicht thermostabilen Polymerasen wie z.B, Sequenase Version 2 
(Amersham Pharmacia Biotech) , Kl enow- Fragment der DNA Polymera- 

15 se I ohne 3» -5' Exonukleaseaktivit&t (Amersham Pharmacia 
Biotech) , AMV-Reverse Transcriptase (Sigma) , M-MLV Reverse 
Transcriptase (Sigma) , HIV-Reverse Transcriptase ohne RNase- 
Aktivitat wird die Reaktionsthemperatur von. konventionellen 37°C 
vorzugsweise auf 20°C bis 30°C reduziert. Bei thermostabilen 

20 Polymerasen wie z.B. Taq- Polymerase (GibcoBRL) , ProHA-DNA- 
Polymerase (Eurogentec) wird die Reakt ions tempera tur von 
konventionellen 70-75°C vorzugsweise auf Werte reduziert, die 
zwischen 30°C und dem Temperaturwert (x) liegen. Dieser 
Temperaturwert (x) hangt von der Tm des Genprodukt- Primer - 

25 Komplexes und wird als Tm (Genprodukt- Primer- Komplex) minus 5°C 
errechnet (z.B. Tm ist 47°C, dann liegt der Temperaturwert (x) 
bei 42°C) . 

In einer anderen bevorzugten Ausfuhrungsform der Erfindung er- 
30 folgt die Anpassung der Reakt ionsbedingungen durch die 
Verminderung der NT* -Konzentration auf unter 5/xmol/l, die 
anderen Parameter der Reaktion (Puf ferbedingungen, 
Temperaturbedingungen) werden konstant gehalten. Die 
Konzentration der NT's liegt vorzugsweise bei dieser Anpassung 
35 zwischen 0.5 und 5/xmol/l. Die Dauer der Reaktion liegt zwischen 
10 sec und 10 min. Das wichtigste bei der Wahl der NT*- 
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Konzentration ist, dass die Polymerase in der vorgegebenen Zeit 
(liegt vorzugsweise zwischen 10 sec und 10 min) ein zweites NT* 
nicht einbaut. 

5 Nach Optimierung der Reaktionsbedingungen fur den Einbau eines 
einzelnen NT* muS man die Reaktion mit gespaltenen NTs* wieder- 
holen. Unter entsprechend geSnderten Reaktionsparametern mu£ 
die Polymerase die gespaltenen NTs* nacheinander einbauen 
konnen . 

10 

Die Optimierungsreaktion korreliert mit dem Einbauschritt, 
Schritt (b) , in einem Zyklus. Die fur die Optimierungsreaktion 
ermittelten Bedingungen die Temperatur, die Konzentration an 
NT*, die Puf ferbedingungen und die Dauer der Reaktion werden fur 
15 die Reaktion auf der Oberflache ubernommen. 

Unter diesen Reaktionsbedingungen erfolgt der Einbau von NT* in 
die zu Genprodukten komplement&ren Strange vorzugsweise so, 
dass an mehr als 50%. der an der Sequenzierungsreaktion 

20 beteiligten Genprodukte ( ext ens ions fahige Genprodukt- Primer- 
Komplexe) in einem Zyklus ein markiertes NT* eingebaut wird, 
vorzugsweise an mehr als 90%. Das hangt damit zusammen, dass an 
manchen Nukleinsaureketten die Reaktion sehr langsam ablauft. 
Ein Einbau der NTs* an jeder komplementaren Position in jedem 

25 Zyklus wird angestrebt, ist aber nicht erforderlich, weil nur 
die erfolgreichen Einbaureaktionen detektiert und ausgewertet 
werden; eine verzogerte Reaktion im Nachfolgenden Zyklus fuhrt 
nicht zu einem Sequenzierungsfehler . 

30 Vorzugsweise wird fur alle NTs* dieselbe Polymerase verwendet. 
Es konnen aber auch verschiedene Polymerasen fur verschiedene 
NTs* eingesetzt werden. 
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4.4.8 Farbiges Kodierungs schema, Anzahl der Farbstoffe 
Einen Zyklus kann man durchfuhren mit: 

5 a) vier verschieden markierten NT*s 

b) zwei verschieden markierten NT*s 

c) einem markierten NT* 

d) zwei verschieden markierten NT*s und zwei unmarkierten 
NTs, 

10 

d.h. 

a) Man kann alle 4 NTs mit verschiedenen Farbstoffen 
markieren und alle 4 gleichzeitig in die Reaktion einsetzten. 

15 Dabei erreicht man die Sequenzierung einer Nukleinsaurekette 
mit einer minimalen Anzahl von Zyklen. Diese Variante der 
Erfindung stellt allerdings hohe Anforderungen an das 
Detektionssystem: 4 verschiedene Farbstoffe mussen in jedem 
Zyklus identif iziert werden. 

20 

b) Zur Vereinfachung der Detektion kann eine Markierung 
mit zwei Farbstoffen gewahlt werden. Dabei werden 2 Paare von 
NTs* gebildet, die jeweils verschieden markiert sind, z.B. A und 
G tragen die Markierung "X", C und U tragen die Markierung "Y" . 

25 In die Reaktion in einem Zyklus (n) werden 2 unterschiedlich 
markierte NTs* gleichzeitig eingesetzt, z.B. C* in Kombination 
mit A*, und im darauf folgenden Zyklus (n+1) werden dann U* und G* 
zugegeben. 

30 c) Man kann auch nur einen einzigen Farbstoff zur Markie- 

rung aller 4 NTs* verwenden und pro Zyklus nur ein NT* 
einsetzen. 

d) In einer technisch vereinfachten Ausfuhrungsform werden 
35 pro Zyklus zwei unterschiedlich markierte NT*s eingesetzt und 
zwei unmarkierte NTs (sogen. 2NT*s / 2NTs-Methode) . 
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4.5 Detektionsapparatur 

Einzelne Molekule auf einer Oberflache kann man mit verschiede- 
5 nen Methoden untersuchen . Es sind mehrere Verfahren bekannt: 
z .B. AtomForce-Mikroscopie, Elektronen-Mikroskopie, Nahf eld- 
Fluoreszenz -Mikroscopie , Weitf eld- Fluoreszenz -Mikroskopie , TIR- 
Mikroskopie usw. (Science 1999 v. 283 1667, Unger et al- BioTech- 
niques 1999 v. 27 S.1008, Ishijaima et al- Cell 1998 v. 92 S.161, 
10 Dickson et al. Science 1996 v. 274 S.966, Xie et al. Science 
1994 v.265 S.361, Nie et al. Science 1994 v. 266 S.1018, Betzig 
et al. Science 1993 v. 262 S.1422). 

Erf indungsgemafi werden Fluoreszenz -Signale einzelner in die 
15 Nukleinsaurekette eingebauter NTs* vorzugsweise mit einem 
Wei tf eld- Fluoreszenz -Mikroskop (Epif luoreszenz) oder einem 
Laser-Scanning-Mikroskop oder einem TIRF-Microskop (Total 
Internal Reflection Fluorescence Microscope) (Weitf eld-Optik- 
Detektionssystem) . 

20 

Es sind verschiedene Varianten der Konstruktion einer solchen 
Apparatur moglich (Weston et al. J.Chem.Phys. 1998 v. 109 
S.7474, Trabesinger et al. Anal. Chem. 1999 v. 71 S.279, Adachi 
et al. Journal of Microscopy 1999 v. 195 S.125, Unger et al. 

25 BioTechniques 1999 v. 27 S.1008, Ishijaima et al. Cell 1998 v. 92 
S.161, Dickson et al. Science 1996 v. 274 S.966, Tokunaga et al. 
Bichem.Biophys.Res.com. 1997 v. 235 S.47, "Confocal Laser 
Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Pu- 
blishers, "New Techniques of optical microscopy and microspec- 

30 troscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence 
microscopy" 1998 2.ed. Herman BIOS Scientific Publishers, 
"Handbook of biological confocal microscopy" 1995 J.Pawley 
Plenum Press ) . Unterschiede in ihrem konkreten Aufbau ergeben 
sich aus der Variation ihrer Einzelteile. Die Vorrichtung fur 

35 das Anregungslicht kann z.B. auf der Basis eines Lasers, einer 
Lampe oder von Dioden funktionieren. Fur die Detektionsvor- 
richtung konnen sowohl CCD-Kameras als auch PMT dienen. Andere 
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Beispiele fur technische Details siehe ("Confocal Laser 
Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Pu- 
blishers, "New Techniques of optical microscopy and microspec- 
troscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence 
5 microscopy" 1998 2.ed. Herman BIOS Scientific Publishers, 
"Handbook of biological confocal microscopy" 1995 J.Pawley 
Plenum Press) . Es ist nicht die Aufgabe dieser Erfindung, alle 
moglichen technischen Varianten einer Detektionsvorrichtung 
aufzuzahlen. Der prinzipielle Aufbau einer geeigneten Apparatur 
10 wird in einem Schema Fig. 7 erlautert. Sie besteht aus 
folgenden Elementen: 

Lichtquelle zur Anregung der Fluoreszenz (1) 
Lichtleitender Teil (2) 
15 Scant isch (3) 

Vorrichtung zur Selektion von Spektren (4) 
Detektionsvorrichtung (5) 

Computer mit Steuerungs- und Analyse funktionen (6) 

20 Diese Elemente der Apparatur konnen kommerziell erworben werden 
(Mikroskop-Firmen: Zeiss, Leica, Nikon, Olympus) . 

Im folgenden soil beispielsweise eine fur die Detektion einzel- 
ner Molekttle geeignete Kombination aus diesen Elementen vor- 
25 gestellt werden: 

Weitfeld-Fluoreszenz-Mikroskop Axioplan 2 (Zeiss) mit Quecksil- 
berdampf lampe 

Objektiv Planneofluar lOOx, NA 1.4 (Zeiss) 
30 Kamera SenSysTM (Photometrix) Oder AxioCam (Zeiss) 
Computer mit Software zur Steuerung und Analyse 

Nachfolgend soli die Vorgehensweise bei der Detektion erlautert 
werden. Man beachte dabei die allgemeinen Regeln der Fluo- 
35 reszezmikroskopie ("Confocal Laser Scanning Microscopy" 1997 
Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of 
optical microscopy and microspectroscopy" 1991 Ed. R.Cherry CRC 
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Press, Inc., "Fluorescence microscopy" 1998 2.ed. Herman BIOS 
Scientific Publishers, "Handbook of biological confocal 
microscopy" 1995 J.Pawley Plenum Press) . 

5 Die Detektion umfafit folgende Phasen: 



1) Vorbereitung zur Detektion 

2) Durchfuhrung eines Detektionsschrittes in jedem Zyklus, 
wobei jeder Detektionsschritt als Scanvorgang ablauft und 

10 folgende Operationen umfafit: 

a) Einstellung der Position des Objektivs (X, Y-Achse) , 

b) Einstellung der Fokusebene (Z-Achse) , 

c) Detektion der Signale einzelner Molekule, Zuordnung des 
Signals zu NT* und Zuordnung des Signals zum jeweiligen 

1 5 Genprodukt , 

d) Verschiebung zur nachsten Position auf der Oberflache. 



Die Signale von in die den Genprodukten komplementaren Strange 
eingebauten NTs* werden durch das Abscannen der Oberflache 

20 registriert. Der Scanvorgang kann in verschiedener Weise 
ausgefuhrt werden ("Confocal Laser Scanning Microscopy" 1997 
Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of 
optical microscopy and microspectroscopy" 1991 Ed. R.Cherry CRC 
Press, Inc., "Fluorescence microscopy" 1998 2.ed. Herman BIOS 

25 Scientific Publishers, "Handbook of biological confocal 
microscopy" 1995 J.Pawley Plenum Press) . Beispielsweise wird 
ein diskontinuierlicher Scanvorgang gewahlt. Dabei wird das 
Objektiv schrittweise liber die Oberflache bewegt (Fig. 8a), so 
dass von jeder Oberf lSchenposition ein zweidimensionales Bild 

30 (2D-Bild) entsteht (Fig. 8b, c) , fur Versuchsanordnung s. 
Beispiel 5 . 

Dieses 2D-Bild kann mit verschiedenen Methoden erstellt werden: 
z.B. durch den Laser-Scan einer Position des Mikroskopf eldes 
35 (Laser-Scanning-Microskopie) Oder durch eine Kameraaufnahme an 
einer Position (vgl. Handbucher der Mikroskopie) . Als Beispiel 
wird die Detektion einzelner Molekule mit einer CCD-Kamera 
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1) Vorbereitung zur Detektion: 

Am Anfang wird festgelegt, wie viele Kopien der Genprodukte zur 
5 Expressionsanalyse notwendig sind. Mehrere Faktoren spielen 
dabei eine Rolle. Die genaue Zahl hangt z.B. von der relativen 
Prasenz der Genprodukte im Ansatz und von der gewunschten 
Genauigkeit der Analyse ab. Die Anzahl der analysierten Gen- 
produkte liegt vorzugsweise zwischen 1000 und 10.000.000. Fur 
10 stark exprimierte Gene kann die Anzahl der analysierten Gen- 
produkte niedrig sein, z.B. 1000 bis 10.000. Bei der Analyse 
schwach exprimierter Gene mufi sie erhoht werden, z.B. auf 
100.000 oder noch weiter. 

Es werden bespielsweise 100.000 einzelne Genprodukte gleichzei- 
15 tig analysiert. Dabei werden auch schwach exprimierte Gene (tnit 
z.B. ca.100 mRNA-Molekiilen/Zelle, was ca. 0.02% Gesamt-mRNA 
entspricht) in der Reaktion mit durchschnittlich 20 identifi- 
zierten Genprodukten reprasentiert . 

20 2) Durchfuhrung eines Detektionsschrittes in jedem Zyklus 

Zur Sequenzierung mussen die Positionen der Genprodukt-Primer- 
Komplexe bestimmt werden, damit man eine Grundlage fur die 
Zuordnung der Signale hat. Die Kenntnis dieser Positionen 
erlaubt eine Aussage daruber, ob die Signale einzelner Molekule 

25 von eingebauten NTs* stammen oder von zufallig an die Oberflache 
gebundenen NTs*. Diese Positionen kdnnen mit verschiedenen 
Methoden identif iziert werden. 

In einer bevorzugten Ausfuhrungsform werden die Positionen 
30 immobilisierter Genprodukte wahrend der Sequenzierung 
identif iziert . Dabei wird die Tatsache genutzt, dass die 
Signale von den in die Nukleinsaurekette eingebauten NTs* immer 
dieselben Koordinaten haben. Das ist durch die Fixierung der 
Nukleinsaureketten gewahrleistet . Die unspezifisch gebundenen 
35 NTs* binden zufallig an verschieden Stellen der Oberflache. 

Zur Identif izierung der Positionen von fixierten Genprodukten 
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warden die Signale auf Ubereinstimmung ihrer Koordinaten aus 
mehreren aufeinander folgenden Zyklen xiberpruft. Das kann z.B. 
am Anfang der Sequenzierung erfolgen. Die ubereinstimmende 
Koordinaten werden als Koordinaten der Genprodukte bewertet und 
5 gespeichert. 

Das Scan- System mufi reproduzierbar iiber mehrere Zyklen die 
Oberflache abscannen konnen. X,Y und Z-Achsen-Einstellungen an 
jeder Oberf lachenposition konnen von einem Computer 
10 kontrolliert werden. Stabilitat und Reproduzierbarkeit der 
Einstellung von Objektivpositionen in jedem Scanvorgang 
entscheiden uber die Qualitat der Detektion und somit iiber die 
Identifizierung der Signale einzelner Molekiile. 

15 a) Einstellung der Position des Objektivs (X,Y-Achse) 

Die mechanische Instabilitat der kommerziell erhaltlichen Scan- 
tische und die geringe Reproduzierbarkeit der wiederholten Ein- 
stellung derselben X, Y-Positionen machen eine prazise Analysen 

20 der Signale einzelner Molekiile iiber mehrere Zyklen schwierig. 
Es existieren viele Moglichkeiten, eine Ubereinstimmung der 
Koordinaten bei wiederholten Einstellungen zu verbessern bzw. 
mogliche Abweichungen zu kontrollieren. Als Beispiel wird eine 
Kontrollmoglichkeit angefuhrt. Nach einer groben mechanischen 

25 Einstellung der Objektivposition wird ein Kontrollbild von 
einem mit der Oberflache fest verbundenen Muster gemacht. Auch 
wenn die mechanische Einstellung nicht exakt dieselben 
Koordinaten aufweist (Abweichungen bis zu 10 pm sind durchaus 
moglich) , kann man mittels optischer Kontrolle eine Korrektur 

30 vornehmen. Das Kontrollbild vom Muster dient als 
Koordinatensystem fur das Bild mit Signalen von eingebauten 
NTs* . Eine Voraussetzung fiir eine solche Korrektur ist, dass 
keine weiteren Bewegungen der Oberflache zwischen diesen beiden 
Aufnahmen gemacht werden. Signale von einzelnen Molekulen 

35 werden in Relation zum Muster gesetzt, so dass eine X,Y- 
Abweichung in der Musterposition gleiche X, Y-Abweichung in der 
Position der Signale einzelner Molekiile bedeutet. Das 
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Kontrollbild vom Muster kann vor, wahrend oder nach der 
Detektion einzelner Molekule gemacht werden. Ein solches Kon- 
trollbild mug entsprechend bei jeder Einstellung auf einer 
neuen Oberf lachenposition gemacht werden. 

5 

b) Einstellung der Fokusebene (Z-Achse) 

Die Oberflache ist nicht absolut flach und weist verschiedene 
Unebenheiten auf. Dadurch verandert sich der Oberf lache-Objek- 
10 tiv-Abstand beim abscannen benachbarter Stellen. Diese Unter- 
schiede im Abstand k6nnen dazu fuhren, dass einzelne Molekule 
die Fokusebene verlassen und so der Detektion entgehen. 

Aus diesem Grund ist es wichtig, dass beim Abscannen der Ober- 
15 flache eine reproduzierbare Einstellung der Fokusebene an jeder 
Objektivposition erreicht wird. 

Es gibt verschiedene Moglichkeiten, die Fokusebene reproduzier- 

bar einzustellen. Beispielsweise kann folgende Methode angewen- 
20 det werden: Da die Anregung einzelner Molekule zum Ausloschen 

ihrer Fluoreszenz fuhren kann, wird auf die Oberflache ein 

Marker aufgebracht, der zur Einstellung der Fokusebene dient. 

Danach erfolgt die Detektion der Signale einzelner Molekule. 

Der Marker kann beliebiger Natur sein (z.B. Farbstoff oder 
25 Muster) , darf aber die Detektion und die Reaktion nicht 

beeintracht igen . 

c) Detektion der Signale einzelner Molekule, Zuordnung des 
Signals zu NT* und Zuordnung des Signals zum jeweiligen Gen- 

30 produkt. 

Das mit Hilfe des Detektionssystems erzeugte zweidimensionale 
Bild der Reaktionsoberf lache enthalt die Signalinforroationen 
von in die Genprodukte eingebauten NT's. Diese mussen vor der 
35 weiteren Verarbeitung aus der Gesamtdatenmenge der Bildinforma- 
tionen mit geeigneten Methoden extrahiert werden. Die dazu 
notwendigen Algorithmen zur Skalierung, Transformation und 
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Filterung der Bildinformationen zahlen zum Standardrepertoir 
der digitalen Bildverarbeitung und Mustererkennung (Hatoer&cker 
P. "Praxis der Digitalen Bildverarbeitung und Mustererkennung". 
Hanser-Verlag, Mtinchen, Wien, 1995; Galbiati L.J. "Machine 
5 vision and digital image processing fundamentals". Prentice 
Hall, Englewood Cliffs, New Jersey, 1990) . Die Signalextraktion 
erfolgt vorzugsweise uber ein Grauwertbild, das die 
Helligkeitsverteiluhg der Reaktionsoberf lache fur den 
jeweiligen Fluoreszenzkanal abbildet. Wenn bei der 
10 Sequenzierungsreaktion mehrere Nukleotide mit unterschiedlichen 
Fluoreszenz-Farbstof fen verwendet werden, kann zunachst fur 
jedes verwendete f luoreszenzmarkierte Nukleotid (A,T,C,G oder 
U) ein separates Grauwert-Bild erzeugt werden. Dafur konnen 
prinzipiell 2 Verfahren angewendet werden: 

15 

1. Durch Verwendung von geeigneten Filtern (Zeiss-Filters&tze) 
wird fur jeden Fluoreszenzkanal ein Grauwertbild erzeugt. 

2. Aus einem auf genommenen Mehrkanal-Farb-Bild werden mit Hilfe 
20 eines geeigneten Algorithmus d\irch ein 

Bildverarbeitungsprogranun die relevanten Farbkanale extrahiert 
und jeweils als Grauwertbild einzeln weiterverarbeitet . Zur 
Kanalextraktion wird dabei ein fur den jeweiligen Kanal 
spezif ischer Farb-Schwellwertalgorithmus eingesetzt . So 
25 entstehen zunachst aus einem Mehrkanal-Farbbild einzelne 
Grauwertbilder 1 bis N. Diese Bilder definieren sich wie folgt: 

GBjj= (s(x,y)) einkanaliges Grauwertbild 

N={l # . . . ,Anzahl der Fluoreszenzkanale} . 
30 M= {0,1,... ,255} Grauwertmenge 

S=(s(x,y)) Bildmatrix des Grauwertbildes 

x=0 , 1 , . . . , L-l Bildzeilen 

y=0,l, . . . ,R-1 Bildspalten 

(x,y) Ortskoordinaten eines Bildpxinktes 

35 s(x,y)e M Grauwert des Bildpunktes. 



Aus dieser Datenmenge wird nun durch ein geeignetes Programm 
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die relevante Bildinformation extrahiert. Ein solches Programm 
sollte folgende Arbeitsschritte realisieren: 

Fiir GB X bis GB„ durchfuhren: 

5 

I. Vorverarbeitung des Bildes, so zum Beispiel gegebenenfalls 
Reduktion des durch die Digitalis ierung der Bildinformation 
entstandenen Bildrauschens, etwa durch Grauwertglattung . 

10 II. Prufung jedes Bildpunkt (x,y) des Grauwertbildes, ob 
dieser Punkt im Zusammenhang mit den ihn umgebenden 
unmittelbaren xind weiter entfernten Nachbarbildpunkten die 
Eigenschaften eines Fluoreszenzpunktes erfullt. Diese 
Eigenschaften hangen unter anderem von der verwendeten 

15 Detektionsapparatur und der Auflosung des Grauwertbildes ab. 
Sie konnen beispielsweise ein typisches Verteilungsmuster von 
Helligkeits-Intensitatswerten fiber einer den Bildpunkt 
umgebenden Matrix darstellen. Die dazu verwendbaren Methoden 
der Bildsegment ierung reichen von einfachen Schwellwert- 

20 verfahren bis hin zur Verwendung neuronaler Netze. 

Erfullt ein Bildpunkt (x,y) diese Anforderungen, dann folgt ein 
Vergleich mit den Koordinaten von in bisher durchgefuhrten 
Sequenzierungszyklen identif izierten Genprodukte. Bei einer 
25 Ubereinstimmung erfolgt die Zuordnung des Signals mit dem aus 
dem jeweiligen Fluoreszenzkanal hervorgehenden Nukleotid zu 
diesem Genprodukt. Signale mit nicht ubereinstimmenden Koor- 
dinaten werden als Hintergrundsignale bewertet xind verworfen. 
Die Analyse der Signale kann parallel zum Scanvorgang erfolgen. 

30 

In einer beispielhaf ten Ausfuhrung wurde ein acht-Bit-Grauwert- 
bild mit einer Auflosung von 1317 x 1035 Pixel verwendet. Um 
die durch die Digitalisierung entstandenen Veranderungen am 
Bild zu reduzieren, erfolgte zunachst eine Vorverarbeitiang des 
35 Gesamtbildes: Jedem Bildpunkt wurde der Mittelwert der 
Helligkeiten seiner 8-Nachbarn zugewiesen. Bei der gewahlten 
Auflosung entsteht dadurch ein fur einen Fluoreszenzpunkt 
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typisches Muster eines zentralen Bildpunkt mit dem groSten 
Helligkeitswert und Nachbarbildpunkten mit nach alien Seiten 
hin abfallenden Helligkeiten. Erfullte ein Bildpunkt diese 
Kritierien und Uberschritt der zentrifugale Helligkeitsabfall 
5 einen bestimmten Schwellenwert (zur Exklusion zu schwacher 
Fluoreszenzpunkte) , dann wurde dieser zentrale Bildpunkt als 
Koordinate eines Fluoreszenzpuriktes gewertet. 

d) Verschiebung des Objektivs zur nachsten Position auf der 
10 Oberflache. Nach der Detektion der Signale einzelner Molekule 
wird das Objektiv uber einer anderen Position der Oberflache 
positioniert . 

Insgesamt kann beispielsweise eine Folge von Aufnahmen mit der 
15 Kontrolle der X, Y-Position, der Einstellung der Fokusebene und 
mit der Detektion einzelner Molekule bei jeder neuen Objek- 
tivposition gemacht werden. Diese Schritte konnen durch einen 
Computer gesteuert werden. 

20 4.6 Zeitlicher Ablauf der Verfahrens schritte 

Der Scanvorgang sowie die biochemische Reaktion nehmen eine 
gewisse Zeit in Anspruch. Wenn man diese Vorgange nacheinander 
schaltet, kann man eine optimale Leistung der Apparatur errei- 
25 chen. In einer bevorzugten Ausfuhrung wird die Reaktion auf 
zwei getrennten Oberflachen durchgefuhrt (Fig. 9) . 

Als Beispiel kann eine Oberflache mit gebundenen Genprodukten 
in 2 raumlich isolierte Teile getrennt werden, so dass 
30 Reaktionen auf diesen beiden Teilen unabhangig voneinander 
ablauf en konnen. In einem anderen Beispiel konnen Genprodukte 
auch von vornherein auf 2 getrennten Oberflachen immobilisiert 
werden. 

35 Danach wird die Reaktion gestartet. Das Prinzip dabei ist, dass 
wahrend auf einem Teil der Oberflache die ResLktions- und Wasch- 
schritte sQ>laufen, der zweite Teil abgescannt wird. Dadurch 
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kann man einen kontinuierlichen Ablauf der Analyse erreichen 
und die Geschwindigkeit der Sequenzierung steigern. 

Die Anzahl der Oberflachen, auf denen die Reaktion ablauf t, 
5 kann auch groSer als 2 sein. Das erscheint dann sinnvoll, wenn 
die Reaktion als zeitlich limitierender Schritt auftritt, d.h. 
die Detektion der Signale auf der Oberflache schneller als die 
Reaktions- und Waschschritte ablauf t. Urn die Gesamtdauer der 
Reaktion an die Detektionsdauer anzupassen, kann jeder einzelne 
10 Schritt der Reaktion auf einer einzelnen Oberflache mit einer 
zeitlichen Verzogerung im Vergleich zur nachsten Oberflache 
ablauf en. 



15 4.7 Analyse 

Die gewonnenen Daten (kurze Sequenzen) werden mit Hilfe eines 
Programms mit bekannten Gensequenzen verglichen. Einem solchen 
Programm kann z.B. ein BLAST Oder FASTA Algorithmus zugrunde 
20 liegen ("Introduction to computational Biology" 1995 M.S. 
Waterman Chapman & Hall) . 

Durch die Wahl der Methode zur Materialvorbereitung wird unter 
anderem festgelegt, in welchen Abschnitten der Genprodukte die 

25 Sequenzen ermittelt werden und zu welchem Strang (sense Oder 
antisense) sie gehoren. Z.B. werden bei der Verwendung der 
polyA-Strecken als Primerbindungsstelle in mRNA Sequenzen aus 
NTRs (non- translating- regions) bestimmt. Bei der Verwendung der 
Methode mit antisense -cDNA als Matrize stammen die ermittelten 

30 Sequenzen unter anderem aus den proteinkodierenden Bereichen 
der Genprodukte . 

Bei einer bevorzugten einfachen Variante der Erfindung wird die 
Genexpression nur qualitativ bestimmt. Dabei ist nur die 
35 Tatsache der Expression bestimmter Gene von Bedeutung. 

Bei einer anderen bevorzugten Aus fuhrungs form ist eine 
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quantitative Bestimmung der verhaltnisse zwischen einzelnen 
Genprodukten im Ansatz von Interesse. Es ist bekannt, dass die 
Aktivitat eines Gens in einer Zelle durch eine Population 
identischer mRNA-Molekule reprasentiert ist. In einer zelle 
5 sind viele Gene gleichzeitig aktiv und werden dabei 
unterschiedlich stark exprimiert, was zum Vorhandensein vieler 
verschiedener unterschiedlich stark reprasentierter mRNA- 
Populationen fxihrt. 

10 Im folgenden wird auf die quantitative Analyse der 
Genexpression nSher eingegangen: 

Fur eine quantitative Analyse der Genexpression werden die 
Abundanzen (Hauf igkeiten) einzelner Genprodukte in der Sequen- 
15 zierungsreaktion bestitrant. Dabei sind die Produkte stark 
exprimierter Gene in der Sequenzierungsreaktion haufiger 
vertreten als die schwach exprimierter Gene. 

Nach der Zuordnung der Sequenzen zu bestimmten Genen wird der 
20 Anteil bzw. die Anzahl der ermittelten Sequenzen fur jedes 
einzelne Gen bzw. Genprodukt bestimmt. Gene mit starker Ex- 
pression haben einen hoheren Anteil an der Gesamtpopulation der 
Genprodukte als Gene mit schwacher Expression. 

25 Die Anzahl der analysierten Genprodukte liegt vorzugsweise 
zwischen 1000 und 10.000.000. Die genaue Anzahl der zu 
analysierenden Genprodukte hangt von der Aufgabenstellung ab. 
Fur stark exprimierte Gene kann sie niedrig sein, z.B. 1000 bis 
10.000. Bei der Analyse schwach exprimierter Gene mufi sie 

30 erhoht werden, z.B. auf 100.000 oder hoher. 

Werden bespielsweise 100.000 einzelne Genprodukte gleichzeitig 
analysiert, sind auch schwach exprimierte Gene, wie z.B. ca.100 
mRNA-Molekille/Zelle (was ca. 0.02% Gesamt-mRNA entspricht) , in 
der Reaktion mit durchschnittlich 20 identif izierten Genproduk- 

35 ten reprasentiert. 



WO 02/088381 PCT/EP02/04657 

- 48 - 

Als interne Kontrolle der Hybridisierung, der Immobilisation 
und der Sequenzierungsreaktion laSt sich folgende Methode 
verwenden: 

5 Es konnen eine oder mehrere Nukleins&ureketten mit bekannten 
Sequenzen als Kontrolle eingesetzt werden (quantitativer 
Marker) . Die Zusammensetzung dieser Kontrollsequenzen ist nicht 
eingeschrankt, sofern sie die Identif izierung der Genprodukte 
nicht storen. Bei der Sequenzanalyse der mRNA-Proben werden 

10 RNA-Kontrollproben, bei der Analyse der cDNA-Proben 
entsprechend DNA-Kontrollproben eingesetzt, Diese Proben werden 
vorzugsweise bei alien Schritten mitgefuhrt. Sie konnen z.B. 
nach der mRNA- Isolation zugegeben werden. Im allgemeinen werden 
die Kontrollproben in gleicher Weise zur Sequenzanalyse 

15 vorbereitet wie die zu analysierenden Genprodukte. 

Die Kontrollsequenzen werden in bekannten, fest eingestellten 
(vorbestimmten) Konzentrationen zu den zu analysierenden Gen- 
produkten zugegeben. Konzentrationen der Kontrollproben konnen 

20 unterschiedlich sein, vorzugsweise liegen diese Konzentrationen 
(d.h. die Gesamtkonzentration der Kontrollsequenzen) zwischen 
0.01% und 10% der Gesamtkonzentration der zu analysierenden 
Probe (100%) . Betragt die Konzentration der mRNA beispielsweise 
lOng/pl, dann liegen die Konzentrationen von Kontrollproben 

25 zwischen Ipg/pl und lng/yl. 

Bei der quantitativen Analyse der Genexpression muS auch die 
allgemeine metabolische Aktivitat der Zellen beriicksichtigt 
werden, insbesondere, wenn ein Vergleich der Expression 
30 bestimmter Gene bei verschiedenen auSeren Bedingungen 
angestrebt wird. 

Die Veranderung im Expressionsniveau eines bestimmten Gens kann 
als Folge der Veranderung in der Transkriptionsrate dieses Gens 
35 oder als Folge einer globalen Veranderung der Genexpression in 
der Zelle auftreten. Zur Beobachtung der metabolischen Zustande 
in der Zelle kann man die Expression der sogenannten "House- 
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keeping -Gene" analysieren. Beim Mangel an wichtigen Metaboliten 
ist beispielsweise das allgemeine Expressionsniveau in der 
Zelle niedrig, so dass auch konstitutiv exprimierte Gene ein 
niedriges Expressionsniveau haben. 

5 

Im Prinzip konnen alle konstitutiv exprimierten Gene als 
"House-keeping-Gene" dienen. Als Beispiele seien das 
Transferrin-Rezeptor-Gen oder das Beta-Aktin-Gen genannt. 
Die Expression dieser House -keeping -Gene dient somit als 
10 BezugsgroSe fur die Analyse der Expression anderer Gene, Die 
Sequenzermittlung und Quantif izierung der Expression der House- 
keeping-Gene ist vorzugsweise ein Bestandteil des Analyse- 
Programms fur die Genexpression. 

15 Die Erfindung wird nachfolgend anhand von Beispielen verdeut- 
licht . 



Beispiele 

20 

BeippjLel Ls 



Modifiziertes dUTP mit einem langen spaltbaren Linker (Fig. 6f- 
1) Als Ausgangssubstanzen dienen 5- (3-Aminoallyl) -2 1 -deoxyuri- 

25 din- 5 1 -triphosphate AA-dUTP, (Sigma) , 3, 3 ■ -Dithio-bis (pro- 
pionsaure- N-Nydroxysuccinimidester) , DTBP-NHS, (Sigma), 2- 
Mercaptoethylamin, MEA, (Sigma) . Zu 100 yl 50mmol/l Losung von 
AA-dUTP in 100mmol/l Borat-Puffer pH 8.5 werden 3 Aquivalente 
an DTBP-NHS in DMF (25 yl 0.4mol/l Ldsung) zugegeben. Das Reak- 

30 tionsgemisch wird 4 Stunden bei RT. inkubiert. AnschlieSend 
wird konz. Ammoniumacetat- Losung (pH 9) zugegeben bis die 
Gesamtkonzentration an CH 3 C00NH 4 in der Reaktionslosung 
100mmol/l ist, und die Reaktion wird eine weitere Stunde 
inJcubiert. Danach werden zu diesem Gemisch 200 pi lmol/1 MEA- 

35 Losung, pH 9, zugegeben und eine Stunde bei RT inkubiert. 
Anschliefcend wird zu diesem Gemisch solange eine gesattigte 
Losung an I 2 in 0.3M KI -Losung zugetropft, bis die Jodfarbe 
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bestehen bleibt. Die modif izierten Nukleotide werden auf einer 
DEAE-Cellulose-Saule in Anunoniumcarbonat -Gradient (pH 8.5) von 
anderen Reaktionsprodukten abgetrennt. Isolierung des 
Nukleotids mit dem spaltbaren Linker erfolgt auf RP-HPLC. An 
5 diesen Linker konnen nun Farbstoffe mit verschiedenen Methoden 
gekoppelt werden ("Handbook of Fluorescent Probes und Research 
Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes, Waggoner 
Method in Enzymology 1995 v. 246, S.362, Jameson et al. Method 
in Enzymology 1997, v. 278, S.363) . 

10 

Auch andere Nukleotidanaloga (z.B. nach Hobbs et al. US Patent 
5,047,519, Khan et al. US Patent 5,821,356) konnen in die 
Reaktion eingesetzt werden, so dass Nukleotidanaloga mit 
Strukturen in Fig. 6f-2,3,4 und 6g-l,2 erzeugt werden konnen. 

15 

Als Beispiel der Ankopplung eines Farbs toffs an den Linker wird 
die Ankopplung von TRITC (Tetramethylrhodamin-5-isothiocyanat , 
Molecular Probes) angegeben (NT*-Struktur Fig. 6j) : 

20 Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird 
in 30 pi 100mmol/l Natrium-Borat- Puffer, pH 9, aufgelost 
(10mmol/l NT*) . Dazu werden 10 pi 10mmol/l TRITC in DMF gegeben 
und 4h bei RT inkubiert. Die Reinigung des mit dem Farbstoff 
modifizierten NT* erfolgt uber RP-HPLC in Methanol -Wasser 

25 Gradient. In ahnlicher Weise konnen andere Farbstoffe an die 
Aminogruppe des Linkers gekoppelt werden. 

Das so hergestellte NT* erfullt die Anforderungen des Einbaus 
in den DNA- Strang, des Fluoreszenznachweises und 
30 Kettenabbruchs nach dem Einbau und der Aufhebung der Hemmung, 
die fur das Gelingen des erf indungsgemafien Verfahrens 
notwendig sind. 

35 Beispiel der Spaltung von Disulf idverbindung im modifizierten 
NT*. Die Spaltung erfolgt durch eine Zugabe von 20 bis 50mmol/l 
DTT Oder Mercaptoethanol (Sigma) Losung pH 8 auf die 
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Reaktionsoberflache. Die Oberflache wird 10 min. mit dieser 
Losung inkubiert, danach wird die Ldsung entfernt und die 
Oberflache mit einer Pufferlosung zur Entfernung von DTT- bzw. 
Mercaptoethanol-Resten gewaschen. 

5 

Beispjel 2; 

Modifiziertes dUTP (dUTP-SS-CH.CHjNH,) mit einem kurzen 
10 spaltbaren Linker (Fig. 6e-l) . Als Ausgangssubstanzen dienen: 
Bis-dUTP, synthetisiert nach Hanna (Method in Enzymology 1989, 
v. 180, S.383), 2-Mercaptoethylamin, MEA, (Sigma). 

Zu 400 pi 100mmol/l Bis-dUTP in 40mmol/l Boratpuffer pH 8.5 
15 werden lOOpl 100mmol/l MEA-Losung, pH 8.5, in H 2 0 zugegeben void 
1 Stunde bei RT inkubiert. Anschliefcend wird zu diesem Gemisch 
solange eine gesattigte Losung an I 2 in 0.3mol/l KI-L6sung zuge- 
tropft, bis die Jodfarbe bestehen bleibt. Die Nukleotide (Bis- 
dUTP und dUTP - SS - CH 2 CH 2 NH 2 ) konnen z.B. durch eine Ethanol- 
20 Prazipitation oder auf einer DEAE-Cellulose-Saule in 
Ammoniumcarbonat- Gradient (pH 8.5) von anderen 

Reaktionsprodukten abgetrennt. Bis-dUTP stdrt bei der 
anschlieSenden Ankopplung eines Farbstoffs an die Aminogruppe 
des Linkers nicht, so dass die Abtrennung des dUTP-SS-C^C^NIL, 
25 von bis-dUTP im Endreinigungsschritt erfolgen kann. 

In einer ahnlichen Weise kann auch dCTP (Fig.6-e2) modifiziert 
werden, dabei dient Bis-dCTP als Ausgangssubstanz 
(synthetisiert nach Hanna et al. Nucleic Acid Research 1993, 
30 v.21, S.2073) . 

Weitere NT* (dUTP* und dCTP*) mit einem kurzen Linkerrest konnen 
in einer ahnlichen Weise synthetisiert werden, wobei NT* 
beispielsweise folgende Strukturen aufweisen konnen (Fig.6e) : 
35 dUTP-SS- (CH 2 ) n -NH 2 , Fig.6e-1, 
dCTP-SS- (CH 2 ) n -NH 2 , Fig.6e-2, 

wo n zwischen 2 und 6 liegt, vorzugsweise zwischen 2 und 4, 
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dUTP-SS-(CH 2 ) n -X-CO- (CH 2 ) m -Z, Fig.6e-3, 
dUTP-SS- (CH 2 ) n -X-CO-Y- (CH^-Z, Fig. 66-4, 
dCTP-SS- (CH 2 ) n -X-CO- (CH 2 ) m -Z, Fig.6e-5, 
dCTP-SS- (CH 2 ) n -X-CO-Y- (CH^-Z, Fig. 6e-6, 
5 X = NH, O, S 
Y = NH, o, s 
Z = NH2, OH, Farbstoff 

wo (n + m) zwischen 4 und 10 liegt, vorzugsweise zwischen 4 und 
6. 

10 

An den Linker konnen nun Farbstoffe mit verschiedenen Methoden 
gekoppelt werden ("Handbook of Fluorescent Probes und Research 
Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes, Waggoner 
Method in Enzymology 1995 v. 246, S.362, Jameson et al. Method 
15 in Enzymology 1997, v. 278, S.363) . 

Als Beispiel der Ankopplung eines Farbstoffs an den Linker wird 
die Ankopplung des FluoroLinkTM Cy3 monofunktional dye 
(Amersham Pharmacia biotech) (NT*-Struktur Fig. 6i) angegeben. 

20 Das ist ein monofunktionaler NHS-Ester-Fluoreszenzf arbstof f . 
Die Reaktion wird nach Angaben des Herstellers durchgef uhrt : 
Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird 
in 300 ]il 100mmol/l Natrium-Borat- Puffer pH 8.5 aufgelost. Dazu 
wird Farbstoff (300nmol) gegeben und lh bei RT inkubiert. Die 

25 Reinigung des mit dem Farbstoff modif izierten NT* erfolgt uber 
RP-HPLC in einem Methanol-Wasser Gradienten. 

Ein weiteres Beispiel der Ankopplung eines Farbstoffs an den 
Linker wird die Ankopplung von TRITC (Tetramethylrhodamin-5- 
30 isothiocyanat, Molecular Probes) angegeben (dUTP-SS-TRITC 
Fig.6h). 

Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird 
in 30 ]il 100mmol/l Natrium -Borat-Puf f er pH 9 aufgelost 
35 (10mmol/l NT*) . Dazu werden 10 yl 10mmol/l TRITC in DMF gegeben 
und 4h bei RT inkubiert. Die Reinigung des mit dem Farbstoff 
modif izierten NT* erfolgt uber RP-HPLC in einem Methanol-Wasser 
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Gradienten. 

Das so hergestellte NT* erfullt die Anf orderungen des Einbaus 
in den DNA-Strang, des Fluoreszenznachweises und 
Kettenabbruchs nach dem Einbau und der Aufhebung der Hemmung, 
5 die fur das Gelingen des erf indungsgemafcen Verfahrens 
notwendig sind. 

Beispiel der Spaltung der Disulf idverbindung im modif izierten 
NT*. Die Spaltung erfolgt durch Zugabe von 20 bis 50mmol/l 
10 Dithiothreitol- Losung (DTT) oder Mercaptoethanol- Losung 
(Sigma), pH 8, auf die Reaktionsoberf lache . Die Oberflache wird 
10 min. mit dieser Losung inkubiert, danach wird die Ldsung 
entfernt und die Oberflache mit einer Pufferlosung zur 
Entfernung von DTT- bzw. Mercaptoethanol-Resten gewaschen. 

15 

Weitere Beispiele fur NT~Strukturen, die im erf indungsgemaSen 
Verfahren verwendet werden konnen sind in Fig. 6k, l,m 
abgebildet. Fur die einzelnen Synthesenschritte siehe 
beispielsweise J.L.Ruth et al. Molecular Pharmacology 1981 v. 20 

20 S.415, L. Otvos et al. NAR 1987 v. 15 S.1763, G.E.Wright et al. 
Pharmac Ther. 1990 v. 47, S.447, ^Nucleotide Analogs; Synthesis 
and Biological Function" K.H. Scheit 1980, Wiley- Interscience 
Publication, "Nucleic acid chemistry" Ed. L.B.Townsend, v. 1-4, 
Wiley- Interscience Publication, "Chemistry of Nucleosides and 

25 Nucleotides" Ed. L.B.Townsend, v. 1-3, Plenum Press. 

Beispiel 3; 

30 Sequenzanalyse mit 4 markierten NTs* 

Bei einer bevorzugten Aug fuhrungs form der Erfindung werden alle 
vier in die Reaktion eingesetzten NTs* mit Fluoreszenz- 
farbstoffen markiert. 

35 

Dabei verwendet man eine der oben genannten farbigen 
Kodierungs schemata. Die Zahl der ermittelten NTs fur jede 
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Sequenz aus einem Genprodukt liegt zwischen 5 und 100, 
idealerweise zwischen 20 und 50. Diese ermittelten Sequenzen 
werden mit Hilfe eines Programms mit bekannten Sequenzen in 
Gen-Datenbanken verglichen und entsprechenden Genen zugeordnet. 
5 Einem solchen Programm kann z.B. der BLAST Oder FASTA 
Algorithmus zugrunde liegen ("Introduction to computational 
Biology" 1995 M.S. Waterman Chapman & Hall). 

Ein Zyklus hat folgende Schritte: 
10 a) Zugabe einer Losung mit markierten Nukleotiden (NTs*) und 
Polymerase zu immobilisierten Nukleins&ureketten, 
b) Inkubation der immobilisierten Nukleinsaureketten mit 
dieser L&sung unter Bedingungen, die zur Verl&ngerung der 
komplementaren Strange urn ein NT geeignet sind, 
15 c) Waschen 

d) Detektion der Signale von einzelnen Molekiilen, 

e) Entfernung der Markierung von den eingebauten Nukleotiden, 

f) Waschen. 

20 

Beispiej 4; 



Sequenzanalyse mit 2 markierten NTs* und 2 unmarkierten NTs 
(2NTs* / 2NTs-Methode) . 

In einer anderen Aus fuhrungs form werden fur die Analyse der 
Sequenzen 2 modifizierte NTs* und 2 unmodif izierte NTs einge- 
setzt. 



30 Diese Aus fuhrungs form beruht auf dem Prinzip, dass eine Abfolge 
aus 2 Signalen (markierte NT*s) geniigend Informationen zur 
Identifizierung einer Sequenz enthalten kann. Die ermittelte 
Sequenz wird mit der Referenzsequenz verglichen und einer 
bestimmten Position zugeordnet, z.B.: 

35 

ACCAAAACACCC - ermittelte Sequenz (dCTP* und dATP* sind 
markiert) 
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ATCATCGTTCGAAATATCGATCX3CCTGATGCC - Ref erenzsequenz 

A-C C-AAA-A-C-A-C-CC (zugeordnete ermittelte Sequenz) 

5 ATCATCGTTCGAAATATCGATCGCCTGATGCC (Ref erenzsequenz) 

Vorzugsweise werden die ermittelten Sequenzen mit Hilfe eines 
Programms der Ref erenzsequenz zugeordnet. Einem solchen 
Programm kann z.B. der BLAST oder FASTA Algorithmus zugrunde 
10 liegen ("Introduction to computational Biology" 1995 M.S. 
Waterman Chapman & Hall) . 

Die Genprodukte werden wie oben beschrieben zur Sequenz ierung 
vorbereitet und mit 2NTs*/2NTs-Methode sequenziert. Man erhalt 

15 Sequenzenabschnitte aus Genprodukten, wobei jede Sequenz eine 
Abfolge aus 2NTs* darstellt. Bekannte Gensequenzen dienen als 
Ref erenz sequenzen. Urn eine eindeutige Zuordnung der ermittelten 
Sequenz zu einer bekannten Ref erenzsequenz zu ermdglichen, muB 
diese Abfolge lang genug sein. Vorzugsweise betragt die Lange 

20 der ermittelten Sequenzen mehr als 20 NT's. Da 2 markierte NTs* 
nur einen Teil der Sequenz darstellen, ist die GesamtlSnge des 
synthetisierten komplementaren Strangs ca. doppelt so lang, wie 
die Abfolge der detektierten NTs* (bei 20 detektierten NTs* 
betragt die Gesamtlange z.B. durchschnittlich 40 NTs) . 

25 

Zur Synthese eines komplementaren Stranges werden 4 Nukleotide 
benotigt. Da die mit einem Fluoreszenzfarbstof f markierten NTs* 
in der vorliegenden Erfindung als Semiterminatoren auftreten, 
d.h. die Termination ausschlieSlich bei Verfugbarkeit modifi- 
30 zierter NTs* auftritt, nriissen unmodif izierte NTs in einem zu- 
satzlichen Schritt in jedem Zyklus in die Reaktion zugegeben 
werden. Die genaue Position dieses Schrittes in dem Zyklus kann 
variieren. Wichtig dabei ist, dass die markierten NTs* und die 
unmodif izierte NTs getrennt verwendet werden. 

35 

Ein Zyklus bei dieser Aus fuhrungs form kann beispielhaft folgen- 
dermaSen aussehen: 
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a) Zugabe einer L6sung mit modif izierten NTs* und Polymerasen 
auf die Oberf lache mit den bereitgestellten Genprodukten 

b) Inkubation der immobilisierten Nukleinsaureketten mit 
5 dieser Losung unter Bedingungen, die zur Verlangerung der 

komplementaren Strange um ein NT geeignet sind, 

c) Waschen 

d) Detektion der Signale von einzelnen, modif izierten und in 
die den Genprodukten komplementaren neusynthetisierten 

10 Strangen eingebauten NTs*-Molekulen 

e) Entfernung der Markierung und der terminierenden Gruppe 
bei den eingebauten Nukleotiden 

f) Waschen 

g) Zugabe von 2 unxnodif izierten NTs und Polymerasen 
15 h) Waschen. 

Beimel 5: 

Die Vorbereitung und die Durchfuhrung der 

Sequenz ierungs r eakt ion 

20 

Die Vorbereitung der Gel-Oberf lache: 

Das Polyacrylamid-Gel fur die Analyse von Reaktionen mit 
einzelnen Molekiilen wird nach allgemeinen Regeln der Gel- 
Vorbereitung fGr elektrophoretische Auftrenn\ing erstellt 
25 (^Electrophoresis" A.T. Andrews, Oxford science publications 
1995) . 

Die Polymerisationsreaktion kann z.B. durch UV-Licht oder 
durch Radikalbildner durchgefuhrt werden. In diesem Beispiel 
wird Ammoniumpersulfat (APS) und TEMED 

30 (Tetramethylethylendiamin) zur Radikalreaktion verwendet, z.B. 
TEMED 0.01% v/v und APS 0.04% w/v. Die 
Komponentenzusammensetzung kann breit variieren, die 
Konzentrationen einzelner Komponenten liegen in folgenden 
Bereichen (errechnet ftir die gebrauchsfertige wassrige AA- 

35 bisAA-Losung) : 

Acrylamid-Monomer (AA) von 3 bis 30%, idealerweise zwischen 10 
und 20% 
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Bis-Ac'rylamid (bis-AA) . im Verhaltnis zum Acrylamid-Monomer 
1:10 bis 1:50, vorzugsweise 1:20. 



Zur Herstellung werden 2 saubere Glasplatten verwendet (mit 
5 Aceton und danach Wasser gewaschen) . Eine Glasplatte (PI) wird 
vorzugsweise mit einem wasserabweisenden Reagenz vorbehandelt, 
z.B Repel-silan, Dimethyldichlorsi lane -Losung, Amersham 
Pharmacia-Biotech. P2 dient als fester Trager fur das Gel und 
kann mit gelbindenden Reagenzien z.B. Bind-silan, 

10 Methacryloxypropyltrimethoxysilane, Amersham Pharmacia- 
Biotech, vorbehandelt werden, so dass es zu einer kovalenten 
Bindung zwischen dem Gel und der Glasoberf lache kommt. Die P2- 
Vorbehandlung mit gelbindenden Reagentien ist dann sinnvoll, 
wenn mehrere Reaktionen mit immobilisierten Molekiilen 

15 durchgefuhrt werden mussen. Bei einer geringeren Anzahl an 
Reaktionen ist eine solche Vorbehandlung nicht notwendig. In 
diesen Fallen reicht, fur P2 eine saubere Glas-Oberf lache aus, 
so dass das Gel allein durch adhasive Krafte an def 
Glasoberf lache haften bleibt. 

20 

Die fertige Polymerisations losung (AA/bisAA- Losung mit 
Radikalbildnern) wird zwischen PI und P2 gegossen, so dass 
eine Schicht mit der Dicke von ca. 5 bis 30 /im resultiert. Die 
Dicke des Gels kann z.B. durch Abstandhalter kontrolliert 
25 werden. Nach Erhartung wird PI entfernt. Das Gel bleibt auf P2 
haften. Es wird mit entionisiertem Wasser gewaschen. 

Das Gel kann direkt weiter verwendet werden oder in 
verschiedenen Fertigungsstadien getrocknet und gelagert 
30 werden. Vor einer Reaktion mit markierten Molekiilen wird das 
Gel normalerweise einige Minuten in der Reaktions- Puffer losung 
aufgequollen und erst dann fur die Reaktion eingesetzt. 

Auf eine so vorbereitete Gel-Oberf lache werden 
35 Nukleinsaureketten durch Austrocknen immobilisiert . 

Beispielsweise wurde eine Losung (ca. 1^1) einer Plasmid-DNA 
(mit Hind III linearisierte, durch Hitze in einzelstrangige 
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Form uberfiihrte pMOS-Blue-Plasmid-DNA ca. 3400 NT lang, 
Konzentration 0.1/xg/^l) auf ca. 10mm 2 der Gel-Oberf lache 
aufgetropft und bei 90° C zum Trocknen gebracht. Die errechnete 
Dichte der immobilisierten Plasmid-Molekiile betrug ca. 1000 
5 pro 1/xm 2 . 

Als Primer wurde das Oligonukleotid 5 ' -AGTGAATTCGAGCTCGGTAC- 3 ' 
verwendet. Die Primerbindungsstelle (nachfolgend f ettgedruckt) 
zusammen mit der fur die Analyse relevanten Verlangerung hat 
folgende Sequenz: 
10 5' -ATCCCCSGGTACCGAGCTCGAATTCACT-3' 

Eine Flow-Cell (Mikrof lussigkeitskanal, MFK) mit der 
Reaktionsoberf lache als Deckel wurde zusammengebaut . Ein 
solcher MFK erlaubt einen schnellen Flussigkeitsaustausch 
15 unter der Geloberf lache. 

Als Vorversuch wurde der Primer (errechnete Tm 45,3° C, 
0.1/imol/l in 50mmol/l Tris-HCl pH 8,7) bei 45° G fur 10 Minuten 
mit der Plasmid-DNA auf der Oberf lache hybridisiert 

20 (Annealing) . Nach einem Waschschritt wurde die Dichte der 
Plasmid-Primer-Komplexe kontrolliert . Die Kontrolle erfolgte 
durch den Einbau von dCTP-Cy3 (Amersham Pharmacia Biotech) 
unter Verwendung von Klenow- Fragment (2Units pro 50/xl in 
20mmol/l Tris-HCl-Puffer, pH 8,5, mit 5mmol/l MgCl a , 15 Minuten 

25 bei 30° C) . Dabei wird nur ein einzelnes dCMP-Cy3 in den 
wachsenden Strang eingebaut. 

Als Detektionsapparatur diente Axioplan 2e (Zeiss) mit der 
CCD-Kamera AxioCam (Zeiss), Fig. 1, 8. 

30 Die Signaldichte der einzelnen, eingebauten dCMP-Cy3-Molekule 
entspricht der Dichte der extensionsfahigen Plasmid-Primer- 
Komplexe. Unter den genannten Bedingungen betrug die Dichte 
der Plasmid-Primer-Komplexe durchschnittlich ca. 15 pro 100 /xm 2 
und lag damit in der gewiinschten Grofienordnung (Fig. 8a- c) . 

35 Auf einer zweiten, in gleicher Weise vorbereiteten Oberflache 
(mit Hind III linearisierte, durch Hitze in einzelstrangige 
Form uberfiihrte pMOS-Blue-Plasmid-DNA ca. 3400 NT lang, 
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Konzentration 0.1/xg//zl mit hybridisierten Primern) wird eine 
zyklische Sequenzierungsreaktion durchgef uhrt . Dabei werden 
dUTP- SS - CH 2 CH 2 NH-R- Cy3 (dUTP*) und dCTP - SS - CI^CHjNH - R - Cy 3 
(dCTP*) (s. Beispiel 2) als reversible Terminatoren verwendet. 
5 Die Detektionsapparatur ist dieselbe wie im Vorversuch- 

Die fur die zyklische Sequenzierungsreaktion verwendeten 
L6sungen setzen sich wie folgt zusammen: 

a) Reaktionslosung fur die Einbaureaktion: 20 mmol/1 Tris-HCl- 
10 Puffer, pH 8.5, 5mmol/l MgCl 2/ 10% Glycerin, Klenow- Fragment 

(Amersham Pharmacia-Biotech) 2U pro 50/il, dUTP* bzw. dCTP*, 
Oder dATP und dGTP je 10 jxmol/1. 

b) Waschlosung: 20 mmol/1 Tris-HCl pH 8.5, 0.01% Na-Azid 

c) Reaktionslosung fur die Abspaltungsreaktion: 20 mmol/1 
15 Tris-HCl, pH 8.5, 50mmol/l Mercaptoethanol . 

Die Einbaureaktionen mit markierten NT*s wurden bei 30° C 15 
Minuten durchgef iihrt . 

20 Im ersten Zyklus der Sequenzierungsreaktion wurde eine 
Reaktionslosung mit dCTP* zugegeben. Nach einem Waschschritt 
wurde ein Detektionsschritt durchgef uhrt , wobei Einzelmolekul- 
Signale mit den zugeordneten x,y-Koordinaten auf der 
Oberfl&che registriert wurden (insgesamt ca. 11.200 Signale) . 

25 Danach wurde die Markierung von den eingebauten NT*s 
abgespalten (Raumtemperatur, 10 Minuten) und die Oberflache 
gewaschen. 

Im zweiten Zyklus wurde eine Reaktionslosung mit dUTP* 
3 0 zugegeben und 15 Minuten lang bei 30° C inkubiert. Nach einem 

anschliefienden Waschschritt wurden die Einzelmolekul-Signalen 

auf der Oberflache detektiert (insgesamt ca. 200 Signale) . 

Dies entspricht dem Hintergrundsignal, das durch eine 

unspezif ische Bindung der NT*s an die Oberflache entsteht . Die 
35 Markierung von den NT*s wurde abgespalten (Raumtemperatur, 10 

Minuten) und die Oberflache mit der Waschlosung gewaschen. 

Im dritten Zyklus wurde eine Reaktionslosung mit dATP und dGTP 
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zugegeben und 15 Minuten lang bei 30° C inkubiert. AnschlieSend 
wurde die Oberflache gewaschen. 

Die Zyklen 1 bis 3 wurden drei mal wiederholt, wobei insgesamt 
ca. 9900 CCU-Zielsequenzen ermittelt wurden. Diese Sequenzen 
konnen eindeutig dem Primer zugeordnet werden. 
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Legenden zu Figuren 1 bid 9 



Legende zu Fig. 1 

5 Schematische Darstellung der Analyse von mRNA- Population 

Der Analyse liegt die Sequenzierung kurzer Abschnitte von mRNA 
zugrunde . 

1) mRNA - die zu analysierende mRNA- Population, in diesem 
10 Beispiel bestehend aus zwei unterschiedlichen mRNA- 

Molekulpopulationen (dunne und dicke Streifen represent ieren 
mRNA-Molekule) 

2) Itnmobilisierte mRNA - an die plane Oberflache gebundene 
15 mRNA-Primer-Komplexe, in diesem Beispiel erfolgt die Bindung 

durch die 01 igo-dT- Primer 

3) Zugabe einer Losung mit Polymerasen und NT*s - der erste 
Schritt in einem Zyklus der Sequenzierungsreaktion 

20 

4) Waschschritt - nach dem Einbauschritt wird die Oberflache 
gewaschen 

5) Detektion - die Signale von einzelnen eingebauten NT*s 
25 werden detektiert 

6) Entfernung der Markierung und der zur Termination fuhrenden 
Gruppe - zur Fortsetzung der Sequenzierungsreaktion werden die 
Markierung und das sterische Hindernis entfernt 

30 

Legende zur Fig. 2 

Beispiel fur allgemeine Struktur von Genprodukt- Primer - 
35 Komplexen 



Fig. 2 In dieser Aus fuhrungs form hat jedes Genprodukt eine 
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einheitliche Primerbindungsstelle (PBS) an seinem 3'-Ende, so 
dass an diese PBS ein einheitlicher Primer binden kann. 

1) Primer 

29 Primerbindungsstelle 

3) Einzelstrangiger Teil des Genprodukts, der analysiert wird 
Legende zur Fig. 3 

10 Ein Beispiel fur die Erzeugung einer einheitlichen 
Primerbindungsstelle (PBS) • 

3a) In diesem Fall werden NTs an das 3'-Ende der 
einzelstrangigen Genprodukte angekoppelt (ein so genanntes 
15 „ Tailing") . Durch Verwendung eines einheitlichen NT entsteht 
eine einheitliche PBS . 

3b) Nach Hybridisierung von Primern entstehen Genprodukt- 
Pr imer - Komplexe 

20 

Legende zur Fig. 4 

Beispiel fur die Bindung von Genprodukten an eine gelartige 
25 Reaktionsoberflache. 

Auf einer festen Unterlage (1) haftet eine Gelschicht (2), 
z.B. ein Polyacrylamidgel (Fig. 4a) , oder haften viele 
Gelkugelchen (5), z.B. Agarosekugelchen (Fig, 4b). An die 

30 Oberfl&che des Gels sind Genprodukte (4) gebunden. Die 
Genprodukte tragen eine funktionelle Gruppe, z.B. Biotin, und 
sind an das Gel uber Streptavidin oder Avidin (3) gebunden. 

35 Legende zur Fig. 5 



Beispiel fur eine Durchf lussvorrichtung 
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Eine gelartige Reaktionsoberf lache (1) ist auf einer fur das 
Anregungs- und Fluoreszenzlicht durchlassigen festeh Unterlage 
(2) befestigt. Sie bilden zusammen den Deckel der Flow-Cell. 
5 Die Flussigkeiten in der Flow-Cell konnen kontrolliert 
ausgetauscht werden, wobei die Flow-Cell zusammen mit 
Vorratsbehalter (3), Pumpe (4) und Ventil (5) eine 
Durchflussvorrichtung bilden. Auf der Reaktionsoberf lache sind 
Genprodukt- Primer- Komplexe gebunden (hier nicht abgebildet) . 
10 Die Signale der eingebauten NT*s werden mit der 
Detektionsapparatur (6) detektiert. 



Legende zur Fig- 6 
15 Strukturen von 2~-Deoxynukleosidtriphosphaten, die im Verfahren 
eingesetzt werden konnen. 

Fig. 6a - Schematische Darstellung der NT-Struktur, bei der 
die spaltbare Gruppe und die sterisch anspruchsvolle, zur 
20 Termination fuhrende Gruppe Teile des Linkers bilden. Der 
Linker ist die Verbindung zwischen Nukleobase und 
Fluoreszenzf arbstof f . 

A,B,C,D,E - Linker, A - der Linkerrest nach der Spaltung, B - 
spaltbare Gruppe, D - sterisch anspruchsvolle, zur Termination 
25 fuhrende Gruppe, F - Fluoreszenzf arbstof f. 

Fig. 6b - Schematische Darstellung der NT-Struktur, wobei die 
spaltbare Gruppe ein Teil des Linkers ist und der 
Fluoreszenzf arbstof f gleichzeitig die sterisch anspruchsvolle, 
3 0 zur Termination fuhrende Gruppe darstellt. 

A,B,C - Linker, A - der Linkerrest nach der Spaltung, B - 
spaltbare Gruppe, D - sterisch anspruchsvolle, zur Termination 
fiihrende Gruppe, F - Fluoreszenzf arbstof f. 

35 Fig. 6c - Schematische Darstellung der Struktur von 
eingebauten NT*s nach dem Abspaltungsschritt . Dargestellt sind 
zwei NT*s mit dem verbliebenen Linkerrest (A) . 
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Pig. 6d - Schematische Darstellung der NT-Struktur, wobei die 
spaltbare Gruppe, die gleichzeitig die sterisch 
5 anspruchsvolle, zur Termination fuhrende Gruppe ist, einen 
Teil des Linkers darstellt. 

A,B, C,D - Linker, A - der Linkerrest nach der Spaltung, B - 
spaltbare Gruppe, D - sterisch anspruchs voile, zur Termination 
fuhrende Gruppe, F - Fluoreszenzf arbstof f . 

10 

Fig. 6e - Darstellung von bevorzugten NT-Strukturen, bei denen 
der Linker an die 5-Position im Pyrimidinring angekoppelt ist. 

Fig. 6f - Darstellung anderer bevorzugter NT-Strukturen, bei 
15 denen der Linker an die 5 -Position im Pyrimidinring 
angekoppelt ist. 

Fig. 6g - Darstellung von bevorzugten NT-Strukturen, bei denen 
der Linker an die 7 -Position im Purinring angekoppelt ist. 

20 

Fig. 6h,i,j - Beispiele fttr die Ankopplung von Farbstoffen an 
den Linker 

Fig. 6k 

25 Strukturen von weiteren 2'-Deoxynukleosidtriphosphaten, die im 
Verfahren eingesetzt werden konnen. Der Linker ist an die 5- 
Position des Pyrimidinrings gekoppelt. 

Die Substituenten Ri, 2 , 3 , 4 sind wahlbar und konnen unabhangig 
30 voneinander auftreten. 

Die Z-Gruppe stellt in einer Ausfuhrungsform (6k-l) die 
Verbindung zwischen dem Linker und der Base dar. Sie ist 
wahlbar und kann eine Amid-, Carbalcoxy- (Ester), Sulfoxy-, 
35 Ether-, Thioether- oder Aminogruppe sein. 

Die E-Gruppe stellt in einer Ausfuhamngsf orm (6k-l) einen 



WO 02/088381 PCT/EP02/04657 

- 65 - 

' (» 

internen Teil des Linkers dar. In einer anderen 
Ausfiihrungsform (6k-2) stellt sie die Verbindung zwischen dem 
Linker und der Base dar. Diese Gruppe ist wahlbar und kann 
eine unverzweigte Alkyl- oder Alkenylkette mit einer Zahl von 
5 Kohlenstof fatomen, vorzugsweise zwischen 1 und 5, sein. 

Die E -Gruppe kann aber auch eine Alkyl- Oder Alkenylkette mit 
einer internen Amid- , Carbalcoxy- (Ester) , Sulf oxy- , Ether- , 
Thioether- oder Aminobindung sein. 

10 Die C-Gruppe ist in diesem Beispiel eine chemisch spaltbare 
Gruppe. In den Ausfuhrungsf ormen (6k-l,2) stellt sie einen 
internen Teil des Linkers dar. In einer anderen 
Ausfuhrungsform (6k-3) stellt sie die Verbindung zwischen dem 
Linker und der Base dar. Diese Gruppe ist wahlbar und kann 

15 eine Ester-, Thioester- und Disulf idverbindung sein. 

Die Y-Gruppe stellt einen internen Teil des Linkers dar, der 
die Verbindung zwischen der spaltbaren Gruppe (C) und dem 
Fluoreszenzfarbstoff (F) herstellt. Diese Gruppe ist wahlbar 
20 und kann eine verzweigte oder unverzweigte Alkyl- oder 
Alkenylkette oder auch eine substituierte oder unsubstituierte 
Arylgruppe sein. Eine weitere mogliche Alternative ist eine 
Alkyl- oder Alkenylkette mit einer internen Amid- Carbalcoxy- 
( Ester) , Sulfoxy-, Ether-, Thioether- oder Aminobindung. 

25 

Die X-Gruppe ist die Verbindung zwischen dem 
Fluoreszenzfarbstoff und dem Linker, wobei diese Verbindung 
sowohl vom Linker, als auch vom Fluoreszenzfarbstoff (F) 
abgeleitet werden kann. Sie ist wahlbar und kann eine Amid-, 
30 Carbalcoxy- (Ester), .Sulfoxy-, Ether-, Thioether- oder 
Aminogruppe sein. 

Fig- 6L 

Strukturen von weiteren 2"-Deoxynukleosidtriphosphaten, die im 
35 Verfahren eingesetzt werden konnen. Der Linker ist an die 7- 
Position des Purinrings gekoppelt. 
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Die Substituenten 1^,2,3,4 sind wahlbar und konnen unabhangig 
voneinander auftreten. 

Die Z-Gruppe stellt in einer Ausfuhrungsform (6L-1) die 
5 Verbindung zwischen dem Linker und der Base dar. Sie ist 
wahlbar und kann eine Amid-, Carbalcoxy- (Ester) # Sulfoxy-, 
Ether-, Thioether- Oder Aminogruppe sein. 

Die E-Gruppe stellt in einer Ausfiihrungsf orm (6L-1) einen 
10 internen Teil des Linkers dar. In einer anderen 
Ausfuhrungsform (6L-2) stellt sie die Verbindung zwischen dem 
Linker und der Base dar. Diese Gruppe ist wahlbar und kann 
eine unverzweigte Alkyl- oder Alkenylkette mit einer Zahl von 
Kohlenstoffatomen, vorzugsweise zwischen 1 und 5, sein. 
15 Die E-Gruppe kann aber auch eine Alkyl- oder Alkenylkette mit 
einer internen Amid-, Carbalcoxy- (Ester), Sulfoxy-, Ether-, 
Thioether- oder Aminobindung sein. 

Die C-Gruppe ist in diesem Beispiel eine chemisch spaltbare 
20 Gruppe. In den Ausfuhrungsformen (6L-1,2) stellt sie einen 
internen Teil des Linkers dar. In einer anderen 
Ausfuhrungsform (6L-3) stellt sie die Verbindung zwischen dem 
Linker und der Base dar. Diese Gruppe ist wShlbar und kann 
eine Ester-, Thioester- und Disulf idverbindung sein. 

25 

Die Y-Gruppe stellt einen internen Teil des Linkers dar, der 
die Verbindung zwischen der spaltbaren Gruppe (C) und dem 
Fluoreszenzfarbstoff (F) herstellt. Diese Gruppe ist wahlbar 
und kann eine verzweigte oder unverzweigte Alkyl- oder 
30 Alkenylkette oder auch eine substituierte oder unsubstituierte 
Arylgruppe sein. Eine weitere mogliche Alternative ist eine 
Alkyl- oder Alkenylkette mit einer internen Amid-, Carbalcoxy- 
(Ester) , Sulfoxy-, Ether-, Thioether- oder Aminobindung. 

35 Die X- Gruppe ist die Verbindung zwischen dem 
Fluoreszenzfarbstoff und dem Linker, wobei diese Verbindung 
sowohl vom Linker, als auch vom Fluoreszenzfarbstoff (F) 
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abgeleitet werden kann. Sie ist wahlbar und kann eine Amid-, 

Carbalcoxy- (Ester), Sulfoxy-, Ether-, Thioether- oder 
Aminogruppe sein. 

5 Fig. 6m 

Weitere Beispiele fur Strukturen von 

2'-Deoxynukleosidtriphosphaten, die im Verfahren eingesetzt 
werden konnen. Der Linker ist an die 5 -Position des 
Pyrimidinrings gekoppelt. 

10 

Die Substituenten 1^,2,3,4 sind wahlbar und konnen unabhangig 
voneinander auftreten. 

Die Y-Gruppe stellt einen internen Teil des Linkers dar, der 
15 die Verbindung zwischen der spaltbaren Gruppe (C) und dem 
Fluoreszenzfarbstoff (F) herstellt. Diese Gruppe ist wahlbar 
und kann eine verzweigte oder unverzweigte Alkyl- oder 
Alkenylkette oder auch eine substituierte oder unsubstituierte 
Arylgruppe sein. Eine weitere mdgliche Alternative ist eine 
20 Alkyl- oder Alkenylkette mi t einer internen Amid-, Carbalcoxy- 
(Ester) , Sulfoxy-, Ether-, Thioether- oder Aminobindung. 

Die X-Gruppe ist die Verbindung zwischen dem 
Fluoreszenzfarbstoff und dem Linker, wobei diese Verbindung 
25 sowohl vom Linker, als auch vom Fluoreszenzfarbstoff (F) 
abgeleitet werden kann. Sie ist wahlbar und kann eine Amid-, 
Carbalcoxy- (Ester), Sulfoxy-, Ether-, Thioether- oder 
Aminogruppe sein. 

30 

Legende zur Fig. 7 

Beispiel fur ein Detektionssystem 

35 Dargestellt ist ein Weitfeld-Optik-Detektionssystem. Nach dem 
Einbau von markierten NT*s wird die Oberflache (7) abgescannt, 
wobei die Fluoreszenzsignale von einzelnen, an die NTs 
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gekoppelten Farbstof fmolekiilen detektiert werden. 
Legends zur Fig. 8 

5 

Schematische Darstellung des Scannvorganges 

Fig. 8a Schematische Darstellung eines Abschnittes der 
Reaktionsoberf lache (grau) , der abgescannt wird. Die Kreise 

10 entsprechen jeweils der Aufnahme eines 2D-Bildes und 
reprasentieren die Fl&chen, von denen die Fluoreszenzsignale 
detektiert werden. Dabei werden pro Aufnahme mehrere Signale 
(beispielsweise 100 bis 10.000) von einzelnen Molekulen 
gleichzeitig registriert. Die Reaktionsoberf lache wird in 

15 jedem Zyklus abgescannt, wobei wahrend des Scannvorganges 
mehrere Aufnahmen von unterschiedlichen Stellen der Oberflache 
gemacht werden. Dabei konnen bis zu mehreren Millionen Signale 
von eingebauten NT*s aufgenommen werden. Die hohe Parallelitat 
ist die Grundlage fur die Geschwindigkeit des Verfahrens. 

20 

Fig. 8b Eine Aufnahme (ein 2D-Bild) mit Signalen von 
einzelnen, eingebauten NT*s. Zur Versuchsbeschreibung siehe 
Beispiel 5. 

25 Fig. 8c Ausschnitt aus Abbildung 8b. Der Ausschnitt zeigt 
Signale von vier eingebauten NT*s. Jedes Signal besitzt 
charakteristische Eigenschaf ten der Einzelmolekulsignale (s. 
Beschreibung) und kann auf Grund dieser identif iziert werden 
(vorzugsweise mit Hilfe eines Computer- Programms) . Jedem der 

30 identif iziert en Signale werden die entsprechenden X,Y- 
Koordinaten zugeordnet. 

Legende zur Fig. 9 

35 

Beispiel einer vorteilhaf ten Anordnung von 

Reaktionsoberf lachen. Der Durchsatz wird durch Verwendung von 
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zwei getrennten Flow-Cells (Mikrof lussigkeitskanale, MFK) 
erhoht. Wahrend in der einen Flow-Cell biochemische und 
chemische Reaktionen ablaufen, wird in der anderen die 
Detektion durchgef iihrt . Anschliefiend tauschen die Flow-Cells 
5 ihre Positionen. 
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P^teQtfrnspruche? 

1- Verfahren zur parallelen Analyse der Genexpression bei dem 
man 

einzelstrangige Genprodukte bereitstellt, man 

die Genprodukte unter Verwendung eines einheitlichen oder 
mehrerer unterschiedlicher Primer in Form von Genprodukt- 
Primer-Komplexen auf einer Reaktionsoberf lache in einer 
zufalligen Anordnung bindet, man 

eine zyklische Aufbaureaktion des komplementaren Stranges 
der Genprodukte unter Verwendung einer oder mehrerer 
Polymerasen durchfuhrt, indem man 

a) zu den auf der Oberflache gebundenen Genprodukt- 
Primer-Komplexen eine Losung zugibt, die eine oder 
mehrere Polymerasen und ein bis vier modifizierte 
Nukleotide (NTs*) enthalt, die mit Fluoreszenzf arb- 
stoffen markiert sind, wobei die bei gleichzeitiger 
Verwendung von mindestens zwei NTs* jeweils an den 
NTs* befindlichen Fluoreszenzf arbstoffe so gewahlt 
sind, dass sich die verwendeten NTs* durch Messung 
vmterschiedlicher Fluoreszenzsignale voneinander 
unterscheiden lassen, wobei die NTs* strukturell an 
der Base so modifiziert sind # dass die Polymerase 
nach Einbau eines solchen NT* in einen wachsenden kom- 
plementaren Strang nicht in der Lage ist, ein weite- 
res NT* in denselben Strang einzubauen 7 wobei der 
Fluoreszenzfarbstof f abspaltbar ist und die struk- 
txirelle Modifikation ein abspaltbarer sterisch an- 
spruchsvoller Ligand ist, man 

b) die in Stufe a) erhaltene stationare Phase unter 
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Bedingungen inkubiert, die zur Verlangerung der kom- 
plementaren Strange geeignet sind, wobei die kom- 
plementaren Strange jeweils vim ein NT* verlangert 
werden, man 

c) die in Stufe b) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfernung nicht in einen 
komplementaren Strang eingebauter NTs* geeignet sind, 
man 

d) die einzelnen, in komplementare Strange eingebauten 
NTs* durch Messen des fur den jeweiligen Fluoreszenz- 
farbstoff charakteristischen Signals detektiert, 
wobei man gleichzeitig die relative Position der 
einzelnen Fluoreszenzsignale auf der Reaktions- 
oberflache bestimmt, man 

e) zur Erzeugung unmarkierter, (NTs oder) Genprodukte 
die Fluoreszenzfarbstoffe und die sterisch an- 
spruchsvollen Liganden von den am komplementaren 
Strang angefugten NTs* abspaltet, man 

f) die in Stufe e) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfernung der Fluores- 
zenzfarbstoffe und der Liganden geeignet sind, man 

die Stufen a) bis f) gegebenenfalls mehrfach wiederholt, 

wobei man die relative Position einzelner Genprodukt- 
Primer-Komplexe auf der Reaktionsoberf lache und die 
Sequenz dieser Genprodukte durch spezifische Zuordnung der 
in Stufe d) in aufeinanderfolgenden Zyklen an den jeweili- 
gen Positionen detektierten Fluoreszenzsignale zu den NTs 
bestimmt und man aus den ermittelten Teilsequenzen die 
Identitat der Genprodukte bestimmt. 



2. Verfahren nach Anspruch 1, dadurch gekennzeichnet , dass 
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man die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in jedem Zyklus nur jeweils 
ein markiertes NT* einsetzt. 

3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass 
man die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in jedem Zyklus jeweils 
zwei unterschiedlich markierte NTs* einsetzt . 

4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass 
man die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in jedem Zyklus jeweils 
vier unterschiedlich markierte NTs* einsetzt, 

5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass 
bereits bekannte Gene als Referenzsequenzen dienen und man 
die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in den Zyklen abwechselnd 
jeweils zwei unterschiedlich markierte NTs* und zwei unmar- 
kierte NTs einsetzt und man die Identitat der Genprodukte 
durch Vergleich der gewonnenen Sequenzen mit denen der 
Referenzsequenzen ermittelt. 

6. Verfahren nach den Anspruchen 1 bis 5, dadurch gekenn- 
zeichnet, dass man in die Genprodukte jeweils eine Primer- 
bindungsstelle (PBS) einfuhrt, wobei die Primerbindungs- 
stellen fur alle Genprodukte jeweils gleiche oder ver- 
schiedene Sequenzen aufweisen. 

7. Verfahren nach den AnsprQchen 1 bis 6, dadurch gekenn- 
zeichnet, dass man die Genprodukte mit Primern in einer 
Losung unter Bedingungen in Kontakt bringt, die zur 
Hybridisierung der Primer an die Primerbindungsstellen 
(PBSs) der Genprodukte geeignet sind, wobei die Primer 
untereinander gleiche Oder verschiedene Sequenzen 
aufweisen, und man die gebildeten Genprodukt-Primer- 
Komplexe anschlieSend auf der Reaktionsoberf lache bindet. 
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Verfahren nach den Anspruchen 1 bis 6, dadurch gekenn- 
zeichnet, dass man die Genprodukte zunachst auf der Reak- 
tionsoberf lache itranobilisiert und erst anschliefcend mit 
Primern unter Bedingungen in Kontakt bringt, die zur 
Hybridisierung der Primer an die Primerbindungsstellen 
(PBSs) der Genprodukte geeignet sind, wobei Genprodukt- 
Primer- Komplexe gebildet werden, wobei die Primer 
untereinander gleiche Oder verschiedene Sequenzen auf- 
weisen. 

Verfahren nach den Anspruchen 1 bis 6, dadurch gekenn- 
zeichnet, dass man die Primer zunachst auf der Reaktions- 
oberf lache immobilisiert und erst anschliefiend mit Gen- 
produkten unter Bedingungen in Kontakt bringt, die zur 
Hybridisierung der Primer an die Primerbindungsstellen 
(PBSs) der Genprodukte geeignet sind, wodurch Genprodukte 
an die Oberflache gebunden und Genprodukt-Primer-Komplexe 
gebildet werden, wobei die Primer untereinander gleiche 
oder verschiedene Sequenzen aufweisen. 

Verfahren nach den Anspruchen 1 bis 9, dadurch 
gekennzeichnet, dass die Dichte der extensionsfahigen 
Genprodukt-Primer-Komplexe zwischen etwa 10 und 100 pro 
100/mi 2 liegt. 

Verfahren nach den Anspruchen 1 bis 10, dadurch gekenn- 
zeichnet, dass der zur strukturellen Modification 
verwendete sterisch anspruchsvolle Ligand der zxir Markie- 
rung verwendete Fluoreszenzfarbstof f ist. 

Verfahren nach den Anspruchen 1 bis 11, dadurch gekenn- 
zeichnet, dass die Reaktionsoberf lache aus der Gruppe 
bestehend aus Silicon, Glas, Keramik, Kunststof fen, Gelen 
ausgewahlt ist, 

Verfahren nach Anspruch 12, dadurch gekennzeichnet, dass 
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die Kunststoffe Polycarbonate oder Polystyrole oder 
Derivate derselben sind. 

14. Verfahren nach Anspruch 12, dadurch gekennzeichnet, dass 
die Gele Agarose- oder Polyacrylamidgele oder Derivate 
derselben sind. 

15. Verfahren nach Anspruch 14, dadurch gekennzeichnet, dass 
die Gele 1 bis 2 % Agarose-Gele oder 5 bis 15 % 
Polyacryl amid- Gele sind. 

16. Verfahren nach den Anspruchen 1 bis 15, dadurch gekenn- 
zeichnet, dass die Polymerase eine Polymerase ohne 3'-5'- 
Exonukleaseaktivitat ist. 

17. Verfahren nach Anspruch 16, dadurch gekennzeichnet, dass 
die Polymerase aus der Gruppe bestehend aus thermolabilen 
viralen, bakteriellen DNA-Polymerasen, thermolabilen oder 
thermostabilen viralen Reversen Transcriptases 
thermostabilen DNA-Polymerasen oder deren Modif ikationen 
ausgewahlt ist. 

18. Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass 
die Polymerase Sequenase Version 2 ist. 

19. Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass 
die Polymerase Taq- Polymerase ist. 

20. Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass 
die Polymerase ProHa-DNA- Polymerase ist. 

21. Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass 
die Polymerase Klenow Fragment der DNA- Polymerase I aus 
E.coli ohne 3 f -5' Exonukleaseaktivitat ist. 



22. Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass 
die Polymerase AMV-Reverse Transcriptase ohne RNase- 
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23. Verfahren nach Anspruch 17, dadurch gekennzeichnet , dass 
die Polymerase M-MLV Reverse Transcriptase ist. 

24. Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass 
die Polymerase HIV-Reverse Transcriptase ohne RNase- 
AktivitSt ist. 

25. Verfahren nach den Anspriichen 1 bis 24, dadurch gekenn- 
zeichnet, dass die Fluoreszenzfarbstof f e aus der Gruppe 
bestehend aus Cyanin-Farbstof fen, Rhodamine, Xanthene und 
deren Derivaten ausgewahlt sind. 

26. Verfahren zur quant itativen Analyse der Genexpression, 
dadurch gekennzeichnet, dass man das Verfahren nach den 
Anspruchen 1 bis 25 durchfuhrt und man anschlieSend die 
Anzahl der ermittelten Sequenzen fur jedes Genprodukt 
bestimmt . 

27. Verfahren nach Anspruch 26, dadurch gekennzeichnet, dass 
man zusatzlich zu den Genprodukten ferner ein Oder mehrere 
Kontrollsequenzen in bekannten Konzentrationen verwendet, 
wobei die Gesamtkonzentration der Kontrollsequenzen zwi- 
schen 0,01 und 10% der Gesamtkonzentration der zu 
analysierenden Probe liegt. 

28. Verfahren nach den Anspruchen 1 bis 27, dadurch 
gekennzeichnet, dafi man eine Sequenzanalyse von mindestens 
etwa 100.000 bis etwa 10.000.000 Genprodukt-Molekulen 
durchfuhrt . 

29. Trager zur Durchfiihrung des Verfahrens nach den 
Anspruchen 1 bis 28, dadurch gekennzeichnet, dass auf 
seiner Oberfl&che die Genprodukte in einer zufalligen 
Anordnung gebunden sind, wobei die Dichte der gebundenen 
Genprodukt -Molekiile zwischen 10 und 100 pro 100/xm 2 liegt. 
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30. Trager zur Durchfuhrung des Verfahrens nach den 
Anspruchen 1 bis 28, dadurch gekennzeichnet, dass auf 
seiner Oberflache die Genprodukte in einer zufalligen 
Anordnung gebunden sind, wobei die Dichte der gebundenen 
Genprodukt-Molekule zwischen 100 und 1.000,000 pro lOOjim 2 
liegt . 

31. Trager zur Durchfiihrung des Verfahrens nach den 
Anspruchen 1 bis 28, dadurch gekennzeichnet , dass auf 
seiner Oberflache die Primer in einer zufalligen 
Anordnung gebunden sind, wobei die Dichte der gebundenen 
Primer-Molekule zwischen 10 und 100 pro 100/xtn 2 liegt. 

32. Trager zur Durchfiihrung des Verfahrens nach den 
Anspruchen 1 bis . 28, dadurch gekennzeichnet, dass auf 
seiner Oberflache die Primer in einer zufalligen 
Anordnung gebunden sind, wobei die Dichte der gebundenen 
Primer-Molekiile zwischen 100 und 10.000 pro lOOpim 2 liegt. 

33. Trager zur Durchftihrung des Verfahrens nach den 
Anspruchen 1 bis 28, dadurch gekennzeichnet, dass auf 
seiner Oberflache die Primer in einer zufalligen 
Anordnung gebunden sind, wobei die Dichte der gebundenen 
Primer-Molekule zwischen 10.000 und 1.000.000 pro lOO^m 2 
liegt . 

34. Kit zur Durchfuhrung des Verfahrens nach den Anspruchen 1 
bis 28, dadurch gekennzeichnet, dass es eine 
Reaktionsoberf lache (einen festen Trager) , zur 
Durchfuhrung des Verfahrens erforderliche Reak- 
tionslosungen, ein oder mehrere Polymerasen, und Nukleoti- 
de (NTs) enthalt, von denen ein bis vier mit Fluoreszenz- 
farbstof fen markiert sind, wobei die markierten NTs ferner 
strukturell so modifiziert sind (NT* bzw. NTs*) , dass die 
Polymerase nach Einbau eines solchen NT* in einen 
wachsenden komplementaren Strang nicht in der Lage ist, 
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ein wei teres NT* in denselben Strang einzubauen, wobei der 
Fluoreszenzfarbstoff . abspaltbar ist und die strukturelle 
Modifikation ein abspaltbarer sterisch anspruchsvoller Li- 
gand ist. 

35. Kit nach Anspruch 34, dadurch gekennzeichnet, dass der zur 
strukturellen Modifikation verwendete sterisch anspruchs- 
volle Ligand der zur Markierung verwendete Fluores- 
zenzfarbstoff ist. 

36. Kit nach Anspruch 34 oder 35, dadurch gekennzeichnet, dass 
es ferner Bestandteile enthalt: 

a) Oligonukleot id- Primer, 

b) zur Abspaltung der Fluoreszenzfarbstoffe und sterisch 
anspruchsvollen Liganden erforderliche Reagenzien, 

und/oder 

c) Waschlosungen. 

37. Kit nach den Ansprttchen 34 bis 36, dadurch gekennzeichnet, 
dass die Reaktionsoberf lache aus der Gruppe bestehend aus 
Silicon, Glas, Keramik, Kunststoffen, Gelen ausgewahlt 
ist. 

38. Kit nach Anspruch 37, dadurch gekennzeichnet, dass die 
Kunststoffe Polycarbonate Oder Polystyrole oder Derivate 
derselben sind. 

39. Kit nach Anspruch 37, dadurch gekennzeichnet, dass die 
Gele Agarose- oder Polyacrylamidgele oder Derivate 
derselben sind. 

40. Kit nach Anspruch 39, dadurch gekennzeichnet, dass die 
Gele 1 bis 2% Agarose-Gele oder 5 bis 15% Polyacrylamid- 
Gele sind. 



41. Kit nach den Anspruchen 34 bis 40, dadurch gekennzeichnet, 
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da£ die Reaktionsoberf lache ein Trager nach den Anspruchen 
29 bis 33 ist. 

42. Kit nach den Anspruchen 34 bis 41, dadurch gekennzeichnet , 
dass die DNA- Polymerase eine DNA- Polymerase ohne 3 t -S t - 
Exonukleaseaktivitat ist . 

43. Kit nach Anspruch 42, dadurch gekennzeichnet, dass die 
Polymerase aus der Gruppe bestehend aus viralen DNA- 
Polymerasen vom Sequenase-Typ, bakteriellen DNA- 
Polymerasen, Reversen Transcriptasen und thermostabilen 
DNA- Polymerasen ausgewahlt ist. 

44. Kit nach Anspruch 43, dadurch gekennzeichnet, dass die 
Polymerase Sequenase Version 2, Klenow Fragment der DNA- 
Polymerase I aus E.coli ohne 3* -5 f Exonukleaseaktivitat, 
AMV-Reverse Transcriptase ohne RNase-Aktivitat, M-MLV Re- 
verse Transcriptase, HIV-Reverse Transcriptase ohne RNase- 
Aktivitat, Taq- Polymerase oder ProHa- DNA- Polymerase ist. 

45. Kit nach den Anspruchen 34 bis 44, dadurch gekennzeichnet, 
dass die Fluoreszenzfarbstof f e aus der Gruppe bestehend 
aus Cyanin-Farbstof fen, Rhodamine, Xanthene und deren 
Derivaten ausgewahlt sind. 

46. Nukleotide der Formel 
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49. Nukleotid nach Anspruch 46 bis 48, dadurch gekennzeichnet , 
dass an die terminale Aminogruppe ein Fluoreszenzf arbstof f 
angeheftet ist. 

50. Nukleotid der Formel 
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6i) 




Linker 



52. Nukleotid der Formel 



6j) dNTP-SS-TRTTC (L 14) 




Linker 



53. Verwendung eines Nukleotids nach den Anspruchen 46 bis 52 
als NT* in einem Verfahren nach den Anspruchen 1 bis 28. 

54. Verwendung eines Nukleotids entsprechend Fig. 6k, 6L, 6m, 
als NT* in einem Verfahren nach den Anspruchen 1 bis 28. 
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i) 



niRNA 



2) 




Immobilisierte mRNA 



3) 




Zugabe einer Losung mit 
Polymerasen und NTs* 



4) 



5) 



6) 




Waschschritt 



Detektion 



Entfernung der Markierung und 
der zur Termination fuhrenden 
Gruppe 



Legende: 

feste OberflSche Polymerase 
mit oligo-dT-Primeni 
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NT* Signal von NT* 



* Mikroskop und 
Beleuchtung 
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Allgemeine Struktur fiir immobilisierte Genprodukte 
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Legende: 



J ) Primer 

2) Primerbindungsstelle 

3) einzelstrangiger Teil des Genprodukts, stammt vom Ausgangsmaterial 
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Nuldeotid-Tailing 
4a) 

5' 3' einzelstrangiges DNA-Fragment 

+ Deoxynucleotidyltransferase 
+ dATP 

i 

5 - (A)„r 



4b) 

Nach der Hybridisiening mlt dcm Primer entsteht folgende Konstruktion 

5' XY(A) n 3~ 

NMCD^ 
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Legende: 

1) feste Oberflache 

2) Gel 

3) zur Immobilisation geeignete Gruppen, 2.B. Avidin oder Streptavidin, oder Oligonukleotide 

4) Genprodukte 

5) Agarosekugelchen 
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Flussrichtung 



Legende: 

1) Reaktionsoberflache 

2) feste Unterlage 

3) Vorratsbehalter 

4) Pumpe 

5) .VentiI . 

6) Objektiv des Mikroskops 




6b) 




Legende: 

A, C, E - Verbindungselemente im Linker 
A - Linkerrest nach der Spaltung 
B - spaltbare Verbindung / Gruppe 
D - zur Termination fiihrende Gruppe 
F - Huoreszenzfarbstoff (Marker) 
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Fig. 6 



6c) eingebaute modifizierte NTs* nach der Spaltung 





Legende: 

A, C, E - Verbindungselemente im Linker 
A - Linkerrest nach der Spaltung 
B - spaltbare Verbindung / Gruppe 
D - zur Termination fiihrende Gruppe 
F - Huoreszenzfarbstoff (Marker) 
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Fig. 6 
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Linker 



6j) dNTP-SS-TRTTC (L 14) 
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R= dUTP 



— v — 
Linker 




R,; R 2 ; R 3 ; R 4 = -OCH 3 ; -CH 3 ; -OH ; -H ; -NH 2 ; -N0 2 ; -O-COAIkyl ; -Halogen 
Z; X = -NH- ; -S- ; -O- ; -CO-NH- ; -CO-O- ; -NH-CO- ; -O-CO- 
C = -CO-S- ; -CO-O- ; -S-S- ; -S-CO- ; -O-CO- 
E = -(CH 2 ) n1 - ; -(CH^CH-CH,)^- ; -(CH^-NH-CO-tCH,),*- 

Y = -(CH 2 ) nl - ; -(CH^CH-CH^- ; -(CH^-NH-CO-fCH^- ; 
n, ; n 2 ; n 3 ; n 4 = 1 - 5 

F = Fluoreszenzfarbstoff 
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Base = A ; G 



R,; Rj; R 3 ; R 4 = -OCH s ; -CH, ; -OH ; -H ; -NH 2 ; -N0 2 ; -O-COAIkyl ; -Halogen 



Z; X = -NH- ; -S- ; -O- ; -CO-NH- ; -CO-O- ; -NH-CO- ; -O-CO- 



C = -CO-S- ; -CO-O- ; -S-S- ; -S-CO- ; -O-CO- 



E = -(CH 2 ) n1 - ; -{CH=CH-CH 2 ) rt2 - ; -(CH^-NH-CO-CCH^- 



R, W' 

Y = -(CH 2 ) n1 - ; -(CH-CH-CH,)^ ; -(CH^-NH-CO-fCH^- ; -Q~ 
n, ; ; n 3 ; n 4 = 1 - 5 



F = Fluoreszenzfarbstoff 
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Fig. 6 



R,; Rj; R3; R« = -OCH3 ; -CH, ; -OH ; -H ; -NH 2 ; -N0 2 ; -O-COAIkyl ; -Halogen 
2; X = -NH- ; -S- ; -O- ; -CO-NH- ; -CO-O- ; -NH-CO- ; -O-CO- 
C = -CO-S- ; -CO-O- ; -S-S- ; -S-CO- ; -O-CO- 

E I Y = -(CH 2 ) n1 - ; -(CH-CH-CH,),*- ; -(CHJ^-NH-CO-tCH^- 
n, ; n 2 ; n 3 ; n 4 = 1 -5 
F = Fluoreszenzf arbstof f 
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Rechner 



n r 



Legende: 

Lichtquelle zur Anregung der Fluoreszenz (1) 
Lichtleitender Teil (2) 
Scanntisch (3) 

Vorrichung zur Selektion von Spektren (4) 
Detektionsvorrichtung (5) 

Komputer mit Steuemngs- und Analysefunktionen (6) 
Oberflache mit immobilisierten Genprodukte (7) 
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Sequenzierungsreaktion auf 2 getrennten Oberflachen. 

WShrend eine Oberflache gescannt wird, werden auf der andem OberflSche alle anderen 
Zyklusschritte durchgefuhrt. 




WO02/088381 



PCT/EP02/04657 



1 



SEQUENZ PROTOKOLL 



<110> Dmitri Tcherkassov 
<110> Prof .Dr.. Walther Traut 
<110> Dr. Englbert Bauml 
<110> Christian Hennig 
<110> Norman Kock 
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<210> 1 
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<212> DNA 
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<220> 

<223> Beschreibung der kunstlichen Sequenz: ermittelte Sequenz (Beispiel 4) 



<210> 2 
<211> 32 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Referenzsequenz (Beispiel 4) 



<400> l 
ACCAAAACAC CC 



19 



<400> 2 

ATCATCGTTC GAAATATCGA TCGCCTGATG CC 



32 



